论文部分内容阅读
随着语义网的发展,本体越来越多地在各个领域被应用。然而由于本体的创建对领域知识的理解不同,侧重的角度不同,使用的建模方法不同,即使是在同一领域的共享概念上创建的本体,不同的本体工程师创建出来的本体也不尽相同,即出现本体异构问题。为了使多个异构的本体能够很好地进行互操作,本体映射越来越受到研究者的重视。本文的工作目的即是进行本体映射方法的研究。
本体包含词汇、语义和结构等多方面信息,现有的研究方法一般通过提取本体中一个或多个方面的信息来进行本体的映射。本文根据实际应用需求,建立一个简化的本体模型,该模型包括概念、概念的上下位层次结构和通过对象属性形成的关系,并使用该本体模型中的信息进行本体概念的映射。本文提出一种基于上下文的概念相似度计算方法,该方法综合考虑概念的语汇特征和语义特征,通过统计概念在语料库中的共现词语构建概念的词汇上下文,并通过分析概念在本体中的语义结构构建概念的语义上下文,将统计信息和语义信息相结合,计算出概念间的相似度数值。另外,本文提出了一些启发式规则,对概念的相似度矩阵中冲突的映射关系进行去重、合并,从而提取出最终的映射关系。本文发现的映射关系十分丰富,不仅包括1:1的简单映射关系,还包含多种复杂的映射关系,能够有效地解决实际的本体异构问题。
在论文的后面,使用了两个实际本体之间的映射作为实验,对本文提出的方法进行了验证。实验结果表明,本文提出的本体映射方法能够有效地进行本体间概念的匹配,具有较高的精度和召回率,同时能够发现丰富的映射关系。