石油学报 ›› 2009, Vol. 30 ›› Issue (4): 542-549.DOI: 10.7623/syxb200904011
李洪奇1,2, 郭海峰1,2, 郭海敏3, 孟照旭1,2,4, 谭锋奇1,2, 张军1,2
LI Hongqi1,2, GUO Haifeng1,2, GUO Haimin3, MENG Zhaoxu1,2,4, TAN Fengqi1,2, ZHANG Jun1,2
摘要: 数据挖掘是应对石油勘探开发未来挑战的10项关键技术之一。提出了一种将预测性数据挖掘技术应用于复杂储层测井评价的方法。将遗传算法应用于特征子集选择和建模参数优化,利用重复交叉验证得到泛化误差的无偏估计,并从选定的多学习算法建模结果中优选出最终预测模型。以克拉玛依油田六中区克下组油藏水淹级别划分为例,在该方法框架内对比研究了8种特征子集方案和决策树、神经网络、支持向量机、贝叶斯网络、组合学习等5种分类方法12种预测模型。结果表明支持向量机预测准确率最高,达91.47%,选择其作为最终预测模型,而决策树模型容易理解,作为辅助参考模型。利用该数据挖掘方法解决油、气、水层识别和岩性划分等问题时,能够获得高性能的分类模型,从而将有效地提高解释精度和符合率。
中图分类号: