论文部分内容阅读
聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分或分组处理的重要手段和方法,在很多领域中都得到了广泛的应用.目前,聚类算法大体上分为划分方法、层次方法、基于密度方法、基于网格方法和基于模型方法.这些算法存在如下的问题:符号属性问题、算法的效率问题、初值的选择问题、对输入顺序的敏感性问题、最优解问题、算法对输入参数的依赖性问题.聚类算法中用得最多的也是最成熟的方法之一是目标聚类法,即在给定聚类数的前提下,根据待聚类样本的属性,优化类中心或隶属度,将它们划分到各个类中.针对地质数据的特点,如何以更直观的方式把分类结果以图的形式表示出来,GIS软件给我们提供了一个很好的平台.GIS(geographicalinformation system)是集地理学、测量学、制图学、遥感学、图形图像学以及计算机科学于一身,是一门边缘学科,GIS技术与应用开发几乎遍及与空间信息有关的所有领域.本文正是一个体现了二者有机结合的实例.作为基础本文首先对数据挖掘做了一个大致的介绍,旨在形成对数据挖掘的一个整体认识,然后对目前数据挖掘中的易混淆的概念进行了介绍和比较.,主要是从矿产预测的角度谈论了目前数据挖掘技术在地球科学中的应用.在此基础上介绍了目前有代表性的一些聚类算法,并对它们的缺点与优势以及各自所适应的具体情形进行分析,并对所介绍算法的多方面性能进行了一个总体的相对比较全面的描述与比较.而本文的目的是通过前面的比较,选择利用一种较好的适合于处理地学数据的聚类算法,在基于MapGis的基础上,针对不同数据文件进行数据处理,给出分类的结果,对成矿的远景预测给出了定量化的预测结果.最后详细介绍了该算法的具体实现和一个应用实例,并讨论本文需要改进的地方和下一步需要做的工作.本文共分六章:第一章 介绍论文选题的目的、意义.第二章 介绍了数据挖掘技术发展简史以及发展前景,阐述了一下易混淆的概念,概括介绍了数据挖掘技术的过程和分类及其在地球科学中的应用.第三章 详细介绍了目前模糊聚类算法的发展现状,对一些常见算法的性能、参数设置、优缺点等方面进行了阐述,介绍了一些模糊聚类算法的在地球科学中的应用以及研究主题.第四章 概述基于Gis的数据挖掘,详细介绍算法的原理、软件模块的设计与实现以及涉及到的相关知识.第五章 以云南省维西—中甸为例,应用模糊聚类算法进行成矿远景预测.第六章 总结建立地质概念模型的步骤、论文创新点和存在的问题以及进下一步需要研究完善的方面.