论文部分内容阅读
传统的石油勘探中资料解释方法是“知识驱动”,即以模型为基础,附加许多假设条件。事实上,并非所有现象可以用公式显式表达。另外,过多的假设条件意味着忽略某些因素。从数据挖掘的角度看,石油勘探资料解释就是从石油勘探数据中发现隐藏的地质信息。数据挖掘是“数据驱动”,避开建立数学物理方程,利用数据挖掘算法直接从数据中提取信息和知识。所以,数据挖掘可以突破传统解释方法的思维瓶颈。 应用数据挖掘之前,首先建立数据仓库。由于石油勘探涉及不同的方法,存在多种数据格式,本文引入本体(ontology)概念,构建了石油勘探ontology,解决了石油数据仓库建模中存在的信息共享和数据集成问题,并提出了基于ontology的石油数据仓库架构。在此平台上,给出了一个应用实例。 地震数据具有空间属性,所蕴含的聚类结构可能为任意形状,而且有噪声和模糊性的,使得许多聚类算法的效果不是很理想。综合考虑到地震数据的这些特点,本文提出一种可以集成空间属性和物理属性的模糊测度,在此基础上,提出基于Fuzzylink的聚类算法。在应用实例时,本文采用两种方式验证聚类效果:二维数据采用可视化的方式;高维数据采用结合分类算法的方式,即先在聚类结果的抽样子集上训练分类模型,然后对其余数据进行测试。实例结果表明所提出的聚类算法可以达到比较好的效果。 本文结合石油勘探的特点和数据挖掘的流程,对石油勘探数据挖掘系统采用模块化设计,分为7个子系统,每个子系统含有若干功能模块,并给出了部分操作界面。