论文部分内容阅读
随着大数据、云计算等科学技术的发展,人们对信息的获取由匮乏到过载转变;对信息阅读形式也由文档式、全文式到图片式、碎片式知识块转变。这些转变驱使着人们重新审视当前的信息资源组织与管理,一方面要认识并重视用户需求转变的现实及存在缘由,另一方面需解决这些转变所引起的知识海量、异构、复杂与语义缺乏等问题,这些问题直接导致用户知识获取效率低下。从细粒度知识单元组织的视角,本文提出了一种新型的知识组织方法——基于知识元的文本资源语义空间,以期丰富当前的数字信息资源组织的语义信息,为用户高效的信息获取与学习提供支持。首先,在总结和分析知识元的国内外研究进展、本体、文本资源语义空间相关理论基础上,提出了一种知识元六元组层次结构表示方法,该方法在内容信息量上简化文本内容,剔除文本中无用信息,抽取代表核心知识的若干知识元,在一定程度上实现知识细粒度化。其次,在层次结构知识元基础上,提出了一种知识元链接的文本资源空间模型及其构建方法,该文本资源语义空间由文本集、概念语义链接网络、知识元语义链接网络构成,文本集为概念语义链接网络和知识元语义链接网格提供数据支持,而概念语义链接网络为知识元语义链接网络提供语义参考依据,同时在概念语义链接网络中构建知识元本体。最后,采集图书情报领域的国内权威期刊《情报学报》上近10年的科技文献作为文本资源集合,构建图书情报学科的知识元本体,对本文所提出的文本资源语义空间进行示例模拟,模拟结果表明该空间能在一定程度上实现文本内容简化、领域层次分明、语义关系丰富,这表明基于知识元的文本资源语义空间作为一种新型的知识资源组织方法在一定程度上是可行的。构建的基于知识元链接的文本资源语义空间是对知识的组织与管理,该空间能使文本内容实现细粒度化,丰富的语义关系能为提高用户学习效率,提升用户学习深度提供支持。但当前的文本抽取技术未能达到本文所需知识元的抽取精准度,因而采用人工抽取知识元方法对文本资源语义空间进行案例验证,同时,深度丰富知识单元之间的语义关系也是下一步深化研究文本资源语义空间的重要方向。