论文部分内容阅读
随着Internet的快速发展,人们越来越习惯于从网上获取各种所需信息,而网上信息量的剧增却导致信息检索的效率日趋下降,出现了严重的“信息过载”和“信息迷航”问题。而对于科研工作者来说,能否更快速更准确地获得本学科领域最新的研究动态成为影响其科研工作的关键因素之一。为此,我们提出了内蒙古自然科学基金项目—“基于本体的自主式‘科研知识共享’的研究”。作为该项目的一个主要部分,本课题—P2P下基于“科研知识本体”的信息检索的研究与实现,主要在前期已建立的领域本体模型基础上,对本体的推理、个人知识管理、基于本体的语义检索技术进行研究,并在分布式环境下实现知识共享的基本功能。本论文的主要工作如下。首先,在学习现有的相关技术及已建立的领域本体的基础上,针对该本体模型及课题需求,本人在.NET环境下设计开发了本课题的本体推理机,它支持领域本体中定义的多种关系的推理功能。推理机是本课题的关键技术之一,是实现语义的基础。其次,本文提出一种人机互动的文档语义预处理方法,以科研人员作为知识筛选的第一关可以有效地提高知识库的使用价值。该方法通过显示本体中定义的概念和属性,帮助用户完成文档的语义标注和抽取过程,从而实现用户对个人科研知识的管理功能。文档的语义标注和抽取是实现语义检索的基础。再次,研究现有的信息检索技术,本文从两方面来设计本课题的语义信息检索算法。一是从用户检索条件出发,本文提出一种基于本体的语义查询扩展方法,借助本课题的推理机对用户检索条件进行语义扩展,不仅可以提高信息检索的查全率及查准率,而且可以有效地解决“检索偏差”问题。二是从资源的组织方式上,本文设计了一种基于本体的资源空间模型,通过语义向量来对资源进行建模,从而有效提高信息检索的效率。在此基础上,针对不同的输入条件实现了单项、双项和多项信息检索算法。最后,通过学习和研究现有的P2P技术,针对本课题的目标,设计开发了本课题的P2P下的科研知识语义信息检索原型系统—SK-SIR(Scientific Knowledge-Semantic Information Retrieval)系统。该系统不仅提供了个人知识管理功能,而且可以在分布式环境下实现知识的共享。