论文部分内容阅读
随着空间数据库(仓库)的快速增长和广泛使用,如何从空间数据中自动地发现空间知识变得越来越重要。空间Co-location模式是一组空间对象的子集,它们的实例在地理空间中频繁的一起出现。当前已有的空间Co-location模式挖掘算法都是旨在找出整个空间上的Co-location模式,即全局Co-location模式。
然而,由于空间属性受各种因素的影响,其实例在空间上并非是均匀分布的,即存在这样的区域,它们的实例在全局上来看并非是频繁Co-location模式,但由于在区域内它们的实例频繁的在一起出现,因而会形成区域频繁Co-location模式,而已有的算法过滤掉了这些区域Co-location模式,因为它们从全局来看,并不是频繁Co-location模式,虽然这些信息是非常有价值的。
与传统的Co-location模式挖掘目的不同,本文旨在挖掘区域Co-location模式。本文首先阐述了挖掘区域Co-location模式的动机;接着就挖掘区域模式面临的问题做出了探讨;然后描述了挖掘区域模式的大体流程;文章重点讨论了如何有效的发现区域,由此引入了聚类的思想来获得有效的区域,并对不同的聚类算法做出了比较,详细的说明了区域模式挖掘期望获得的簇,论述了在实验中为什么选择Cure算法:接下来文章就选择传统的全连接算法来挖掘区域Co-location模式做出了解释;文章的最后部分是实验分析,在模拟数据上做的实验说明了本文算法的正确性和有效性,这些区域模式用传统的挖掘算法是无法获得的,这进一步说明了挖掘区域模式的意义。