论文部分内容阅读
空间信息获取与应用技术的不断发展,带来了各类空间数据的飞速增长和应用领域的不断扩大,使得空间信息的检索表现出越加重要的作用和地位。随着越来越多非专业人员利用空间信息检索获取所需信息,传统的空间信息检索常常采用的与地理术语相关的组合式检索技术,其专业性和复杂性往往难以为大多数非专业人员所掌握。能否以自然语言形式来描述空间信息检索需求,成为国内外空间信息检索界广泛关注和着力解决的关键技术之一。
从信息检索角度,自然语言检索方式近年来在专家系统、情报检索、办公室自动化系统的人机接口应用中获得了大多数用户的认可和使用,同时基于自然语言的信息检索方式在实际应用中,需要面临不同应用领域中信息检索的特殊性要求。从技术实现角度,基于语义本体的检索技术,是自然语言检索的关键技术之一。在空间信息检索中存在的时空分析、数据多样性、数据相似性检索、知识不确定性等特点,需要在自然语言检索的语义本体层次,提供对应的信息检索方式与匹配方法。从技术研究角度,这就要求本体技术在自然语言理解、领域知识描述、相似性检索和不确定性推理等方面,提供较好的解决方案与性能。
虽然下一代互联网技术引入了语义本体技术并定义了应用框架,可以提供基础的语义描述方法和知识推理技术。但是基于现有研究成果和水平,在空间信息自然语言检索应用中,本体技术在自然语言理解、不确定性知识描述、相似性检索和不确定性推理等方面,均存在一定的局限性。这些问题的解决对于本体在空间信息自然语言检索中的应用将提供有力的支持,对于实现高效、灵活的空间信息检索具有重要的研究意义和应用价值。
对此,本文以空间信息的智能化检索为应用背景,针对本体技术在以上几个语义描述和推理能力方面的局限性,从本体对自然语句中用户检索需求的理解、本体对不确定性领域知识的描述、本体操作对近似性检索和推理的支持等几个方面展开深入的研究,尝试对本体描述机制和推理能力进行扩展或改善。力图从语义分析角度,解决空间信息自然语言检索中各类关键技术问题,构建并实现具有语义检索能力的空间数据服务语义化检索系统。
本论文的主要工作和贡献如下:
1.提出了本体模型和语言模型相结合的自然检索语句解析方法。针对本体对自然检索语句中动词理解能力的局限性,尝试将语言认知模型和本体模型相结合,试图利用语言模型中对谓词的表达和解析方法,从句类分析角度来解决自然语句中动词和名词不同搭配的含义理解问题,目的在于获得以语义关联图形式描述的用户检索需求,实现自然检索语句到本体形式化描述语句的转变,为基于本体的信息检索和推理提供初始条件和检索依据。
2.建立了基于可能性逻辑和概率统计方法的语义关系定量化描述机制。针对本体对不确定性知识描述的局限性,尝试将反映主观经验的可能性度量和代表客观特征的概率统计方法相结合,试图利用可能性逻辑的灵活性和概率统计的全局性特点,解决各类不确定性语义关系的定量化描述问题,实现语义描述机制从定性化到定量化的转变,为本体的相关性检索和不确定推理提供语义强度的定量化度量手段。
3.提出了基于激活扩散算法的本体相关性检索和不确定推理方法。针对定量化语义知识空间中信息检索的近似性和推理的非精确性,尝试利用语义关系的分类度量方法来对激活扩散算法进行改进,将本体相关性检索分为多个阶段来进行,试图提高激活扩散过程的针对性和导向性;尝试将激活扩散算法和本体推理规则相结合,利用激活扩散的路径检索能力和本体推理规则的潜在语义关系描述机制,试图在激活扩散获得的语义关联网中依据推理规则发现隐含的语义关联,实现更多相关信息节点的推理发现,为需求和资源间的相似性检索提供匹配和推理机制。
4.综合利用上述研究成果,设计并实现空间数据服务的语义化查询原型系统。该系统以包含有检索需求的自然语句为输入,以带有定量化度量值的数据服务检索列表为输出。对该系统中涉及的检索需求的本体化描述,空间数据服务的本体化描述,基于激活扩散算法的空间数据服务检索和匹配等关键技术进行了说明。最后通过两个典型检索案例的试运行结果来分析该系统的优势和不足,并对本文的相关研究成果进行了总结和评价。