论文部分内容阅读
目前,地理信息科学的发展趋势之一是整合不断增长的地理空间数据。这些数据来自于政府、志愿者、科学研究和企业,形成了大量不连通的空间数据岛。空间数据融合能有效防止数据隔离,实现不同来源空间数据的属性共享和几何精度改进,并降低数据的生产成本。但融合的前提是找到不同数据集之间的同名实体并建立其对应关系,这被称为实体匹配。此外,实体匹配还在空间数据更新、评估和管理方面发挥着重要作用。因此,实体匹配已经成为地理空间数据集的基本研究问题。本文以面实体为研究对象,研究面实体的匹配方法,以此进一步探讨众源地理信息质量改善和陆海基础空间要素数据融合的方法,为自动化提供丰富、准确和现势性强的空间数据资源支撑,主要研究内容包括以下几方面:(1)对面实体匹配方法进行了全面的回顾和总结。实体匹配的目的是发现同名实体,本文从空间表达、属性表达和时间表达三个方面来定义同名实体的概念,并介绍了同名实体差异的来源和表现形式。最后对面实体匹配中最复杂的M:N匹配类型进行了剖析,论述了 M:N匹配的难点所在和当前解决方法的限制。(2)针对匹配数据来源多样,往往存在位置偏差、不同细节层次(LODs,different levels of detail)和空间分布密度等问题,提出一种基于MBR组合优化算法和空间域的M:N面实体匹配方法。首先,提出了一个改进双向面积重叠技术的设想。从该设想出发,提出了 MBR组合优化算法来检测1:1和1:N匹配的对应MBR;然后,提出了利用空间域来增强MBR组合优化算法使其能够检测M:N匹配的对应MBR。最后,通过顾及局部和全局的面积重叠率特征发现几何上的同名实体。(3)针对匹配数据中存在位置偏差,且同名实体几何对应情况较差等问题,设计了一种迭代匹配框架,其结合了上下文信息可以减少匹配对的模糊性和机器学习算法可提高匹配评估的准确度的优点。首先,在局部结构中使用邻域地标去识别潜在匹配对。然后,通过一种基于距离、大小、方向、形状和上下文信息的人工神经网络评价模型来发现正确的匹配对。最后,在迭代框架中通过已获得地表对(匹配对)来检测新的地标对,直到识别全部的匹配对。(4)针对众源地理信息现势好,但几何精度较差等问题,本文提出了一种利用高几何精度的空间数据来改善众源地理信息位置精度的方法。首先,本文采用基于MBR组合优化算法和空间域的匹配方法识别整合数据之间的同名实体。然后,提出基于几何相似性的成对约束谱匹配算法检测1:1、1:N和M:N同名实体之间的共轭点对。针对1:N和M:N匹配中不可避免存在弱对应点对和错误对应点对的问题,提出基于IGG1(Insititute of Geodesy and Geophysics,大地测量学与地球物理研究所)权重的最小二乘法来有效对齐同名实体。本文将所提出的方法应用于对齐较高位置精度的基础测绘数据和较低位置精度的谷歌地图数据,获得了差异最小化的地图对齐结果。(5)浙江DLG(Digital Line Graphic,数字线划图)数据库管理方案中,1:2000岛礁基础空间数据库、1:10000滩涂基础空间数据库、1:25000水下地形基础空间数据库和1:10000陆地基础空间数据库是独立存在的,但它们之间存在数据重叠区域。本文采用所提出的面实体匹配方法融合多源多尺度的陆海基础空间数据库中的面实体,以实现其精度提升、冗余减少和统一管理的目标。首先,建立陆海基础空间要素统一的分类编码、融合规则和一体化库。然后,通过面实体匹配方法建立融合数据中同名实体之间的关联。最后,依据数据集成规则对陆海基础空间数据库中同名实体进行融合。