论文部分内容阅读
GIS系统中含有大量的空间数据和属性数据,有着比一般关系数据库和事务数据库更加丰富和复杂的语义信息,隐藏着丰富的知识。但是现在的GIS系统仅能进行数据的收集、查询和简单的统计等功能,无法从这些大量的空间数据中挖掘出对决策具有指导意义的知识,需要借助于空间数据挖掘技术。而空间关联规则是空间数据挖掘的一种重要知识类型,它侧重于数据项集之间的关联或相关联系,找出满足给定支持度和可信度阈值的多个空间谓词之间的依赖关系。本文的主要研究工作如下:
1、阐述空间数据挖掘的相关理论和概念,讲述了空间数据挖掘的知识分类与研究方法,介绍了现有的几种空间数据挖掘系统,并探讨了空间知识的表达方式。
2、分析了GIS数据结构、数据特点以及GIS数据的复杂性,讨论了可以从GIS数据中挖掘的空间知识类型,研究了GIS数据中空间分析与空间数据挖掘的区别与联系,探讨GIS与空间数据挖掘的几种集成模式,并分析研究了几种模式各自的优缺点,给出一种适于GIS的挖掘系统体系结构。
3、研究关联规则Apriori算法,分析研究了传统的关联规则理论基础、经典算法,多层关联规则算法及多层空间关联规则算法。在充分理解关联规则理论的基础上,提出了一种适于GIS的多层空间关联规则改进算法,分析了该算法的可行性并在原型系统进行了验证。算法分为两个部分,第一部分利用GIS中的空间分析技术和空间关系处理等对地理空间数据中的考察目标和相关对象的空间拓扑关系进行描述,生成以空间谓词为主的空间概念层次关系;第二部分利用预定义的空间概念层次关系对提取的空间谓词集,使用算法进行空间关联规则的挖掘。这种算法有效地利用了GIS中的空间分析技术,能够方便地处理了空间数据间的空间关系,通过复杂的空间计算和分析求得空间对象之间的关联规则。
4、在研究相关理论的基础上,设计了一个基于MAPGIS的空间数据挖掘原型系统。系统是采用GIS二次开发方式,把空间谓词转化为中间数据,进而进行挖掘。原型系统包含三个功能模块:用户接口模块、空间谓词提取模块、挖掘模块,并以武汉市高校与山丘地图作为实验数据进行了实例验证。