空间聚类算法研究

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:hong_77521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
经过十几年的研究和实践,数据挖掘技术已经吸收了许多学科的最新研究成果,而形成独具特色的结构分支。其中,聚类算法作为数据挖掘工具集中的一个模块,具有广泛的应用价值。典型的聚类算法有K-Means、CLARANS、BIRCH、CURE、DBSCAN等。GIS空间数据库里的数据主要有矢量数据和栅格数据,矢量数据按其用途可以拆分为几何数据和属性数据,不同类型的数据对其进行聚类用到的算法不尽相同。本文根据聚类算法性能优劣的比较,提取三种效果较好的聚类算法:MMC算法、基于网格和密度的算法以及数据场算法,对空间数据库中的二维矢量数据进行了聚类分析,克服了传统经典算法对数据输入顺序敏感、不能处理高维数据以及发现不了离群值和空洞等缺陷。 本文首先介绍聚类算法的发展现状,而后对空间数据的特征和聚类算法的性能进行了分析和比较。接着选取三种有效的聚类算法对二维几何点数据进行聚类,其中,MMC算法利用buffer分析(膨胀和侵蚀)完成聚类过程,能发现任意形状的聚类、离群值和空洞;基于网格和密度的算法将数据空间分割成网格(grid)状,将落到某个单元中的点的个数当成这个单元的密度(density),基于网格和密度的算法适用于高维数据,因为实验数据是二维的,所以采用clique算法完成了二维点数据的空间聚类;数据场算法将聚类看成动态的行为,引入了场和势函数的理论,数据场中的客体通过势函数相互作用,该方法对噪声数据具有较强的适应能力。 最后,利用VC++开发工具完成了MMC和clique算法的实现,并从多方面对算法进行测试。
其他文献
时态地理信息系统(TGIS)是GIS的重要研究方向。TGIS把GIS概念从单一的空间维扩展到了时间维。近些年来,随着TGIS应用面的不断扩大,TGIS也涌现了大量的技术细节上的问题。解决这
随着社会的不断发展,不同文化背景、不同语言习惯的人们在文化,经贸等各个领域的交流日渐频繁,语言障碍成为人们交流过程中遇到的主要障碍。统计机器翻译(Statistical Machine T
随着通讯技术的发展,网络中的同一信息可能保存在不同的网络设备中,当修改一网络设备中的信息时,另一网络设备中的相同信息也应做相应的改变,这就引入了同一信息在不同网络设备中
地理信息系统(GIS)为房地产数据的获取、存贮、分析、处理提供了强有力的工具和先进的技术手段,国内外许多房政管理部门都建立了各自的房地产地理信息系统(REGIS)。目前,GIS在
球面点的分布问题,是世界性数学难题。球面点分布问题有许多不同的求解目标,可以分为最优球面覆盖问题,α-能量最小问题,球面等面积划分等问题,这些不同的求解目标分别对应着不同
随着计算机技术、网络技术、控制技术和通讯技术的发展,计算机网络系统已泛应用在通讯、工业生产、建筑、医疗、办公、消防、环保等领域。构建一个先进、实刚、安全、可靠的计
本文在综合分析我国土壤养分管理研究现状和WebGIS实现方法基础上,深入研究了:WebGIS的体系结构、实现技术;ASP.NET(Active Sewer Pages)技术及其在Web开发中的应用;Javascript技
客户关系管理(CRM)是一种先进的管理理念,要求企业以客户为导向,整合内外流程,持续改进对客户的服务水平。CRM也是一种管理软件和技术,它将最佳的商业实践与数据挖掘、数据仓库、
本文研究和实现了一个图形化流程编辑器原型。在文中,首先,根据流程的定义,提出了自己对流程定义的理解并提出了一个流程模型。其次,研究和讨论了流程图的基本元素,并提出其元素的
随着人们对网络应用和服务的高效性、可用性和可靠性等诸多性能的要求不断提高,从网络管理的角度对网络服务的运行状况进行实时监控管理,是保障网络高效运行的重要环节。本课题