论文部分内容阅读
语义Web是Web发展的延伸,其目标是使Web上的信息具有计算机可理解的语义。本体则描述了其中的语义,本体是实现语义Web的关键要素。在计算机科学领域,本体被定义为共享概念模型的形式化规范说明,它反映了领域专家对该领域知识的看法。由于语义Web分布式的特点,数据来自于多个不同的本体,这些海量异构本体为信息共享带来了不便。为了实现异构本体间的互操作,本体映射是最有效的解决方法。
本文在对语义Web相关技术进行研究的基础上,分析了造成本体异质的原因及其对应的解决方法,定义本体相似度,对比分析已有本体映射系统,针对已有系统的计算量大和计算不够全面的问题和不足,提出多策略综合相似度映射模型MSCMOM。
计算语义相似度是本体映射的关键技术,相似度计算的准确性决定了本体映射成功与否。本文在分析本体映射研究现状的基础上,针对本体概念名称、概念定义、概念实例、概念结构和概念属性特征,提出一种基于多策略综合相似度本体映射模型,实现异构本体间的映射。最后通过输入两个本体实例来对整个相似度计算过程进行模拟,验证了该模型相似度计算是准确可行的。
本文的创新性工作有:
△采用候选映射集思想对相似度计算对进行过滤,减少本体相似度计算量;
△在属性相似度计算时,采用信息增益策略,减少属性相似度的计算量;
△提出多策略综合相似度本体映射模型。