基于知识元的文本资源语义空间研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:Rainwave
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据、云计算等科学技术的发展,人们对信息的获取由匮乏到过载转变;对信息阅读形式也由文档式、全文式到图片式、碎片式知识块转变。这些转变驱使着人们重新审视当前的信息资源组织与管理,一方面要认识并重视用户需求转变的现实及存在缘由,另一方面需解决这些转变所引起的知识海量、异构、复杂与语义缺乏等问题,这些问题直接导致用户知识获取效率低下。从细粒度知识单元组织的视角,本文提出了一种新型的知识组织方法——基于知识元的文本资源语义空间,以期丰富当前的数字信息资源组织的语义信息,为用户高效的信息获取与学习提供支持。首先,在总结和分析知识元的国内外研究进展、本体、文本资源语义空间相关理论基础上,提出了一种知识元六元组层次结构表示方法,该方法在内容信息量上简化文本内容,剔除文本中无用信息,抽取代表核心知识的若干知识元,在一定程度上实现知识细粒度化。其次,在层次结构知识元基础上,提出了一种知识元链接的文本资源空间模型及其构建方法,该文本资源语义空间由文本集、概念语义链接网络、知识元语义链接网络构成,文本集为概念语义链接网络和知识元语义链接网格提供数据支持,而概念语义链接网络为知识元语义链接网络提供语义参考依据,同时在概念语义链接网络中构建知识元本体。最后,采集图书情报领域的国内权威期刊《情报学报》上近10年的科技文献作为文本资源集合,构建图书情报学科的知识元本体,对本文所提出的文本资源语义空间进行示例模拟,模拟结果表明该空间能在一定程度上实现文本内容简化、领域层次分明、语义关系丰富,这表明基于知识元的文本资源语义空间作为一种新型的知识资源组织方法在一定程度上是可行的。构建的基于知识元链接的文本资源语义空间是对知识的组织与管理,该空间能使文本内容实现细粒度化,丰富的语义关系能为提高用户学习效率,提升用户学习深度提供支持。但当前的文本抽取技术未能达到本文所需知识元的抽取精准度,因而采用人工抽取知识元方法对文本资源语义空间进行案例验证,同时,深度丰富知识单元之间的语义关系也是下一步深化研究文本资源语义空间的重要方向。
其他文献
建立了γ-羟基丁酸(GHB)及其前体物质γ-丁内酯(GBL)和1,4-丁二醇(1,4-BD)超高效液相色谱-质谱联用(UPLC-M S/M S)定性定量的检测方法。样品经滤膜过滤,使用Waters Atlantis
连续13个涨停板,累计最大涨幅650%,随着中简科技(300777.SZ)的上市与股价暴涨,碳纤维产业再次成为资本市场关注的焦点。而就在前不久,ST康得(002450.SZ)母公司康得集团大举押注碳纤维投资失败的热度尚未散去。  新材料产业投资普遍具有高投入、高风险、高回报的特点。碳纤维投资过程中,前期的研发和中期的设备采购、后期的市场推广都需要巨量的资金投入,这对于企业而言无疑是巨大的压力。  
我市从去年开始的殡葬改革,经过“中元节”、“寒食节”、除夕等每一个时间节点的大力宣传、严格执法、全力检查,已经看到了显著成果。文明祭祀观念在市民心中逐渐生根,绿色祭祀
报纸
结合内昆线重点工程老煤洞特大桥的现场施工实践 ,对 C2 8机制砂混凝土的配制和远距离高泵程泵送技术进行了研究 ,并获得成功。这一试验研究的成功 ,不仅取得了良好的经济效
作为一家主业突出、业绩表现常年良好的绩优股,宇通客车(600066.SH)很少进行各类股权运作。  但在2019年1月,宇通客车董事长汤玉祥通过控股的西藏德锦,拿下了另外一家上市公司汇通能源(600605.SH)的实际控制权。  这家市值在20亿元以下的上市公司乏善可陈,2018年净利润仅有1700余万元。但能够被汤玉祥相中并且以9亿元的代价买下30%股份,汇通能源显然有利润之外的价值。  根据汇
当前,我国通用航空制造业发展面临关键领域自主创新能力不强、实现全球价值链攀升愈加困难、持续发展动力机制尚未形成等问题。随着我国在前沿科技领域加快布局,通用航空制造