【摘 要】
:
面对互联网中大量以非结构化形式存在的、缺乏语义的信息资源,计算机还无法自动地对web中的信息进行理解和处理。Apache Stanbol系统利用语义网技术,可以将传统的内容管理系统
论文部分内容阅读
面对互联网中大量以非结构化形式存在的、缺乏语义的信息资源,计算机还无法自动地对web中的信息进行理解和处理。Apache Stanbol系统利用语义网技术,可以将传统的内容管理系统拓展为包含语义信息的语义内容管理系统。它可以从多种语言类型内容中抽取出特定实体,并将实体映射到DBPedia知识库中实现语义扩充,经过语义标注后,计算机可在此基础上自动地实现推理、知识检索、内容分类等功能,以实现对多源信息的知识聚合及知识发现等服务。作者在对相关典型框架及中文自然语言处理工具进行调研基础上,经过实验分析提出了Stanbol系统处理中文的解决方案:以Stanbol系统为基础,利用开源自然语言处理工具(StanfordNLP)和中文百科知识库等进行二次开发。 文章首先对国内外处理非结构信息的典型框架结合其应用进行分析和比较,以理清现阶段国内外对非结构化信息进行分析和使用的现状。然后重点对Stanbol系统内部进行分析,包括系统概况调研、系统的整体架构分析、对英文信息抽取过程分析等,在此基础上得出Stanbol系统对中文信息处理的不足的原因并提出解决思路。接着结合文章研究目的,设计并实现了Stanbol对中文信息处理的系统原型,主要包括三大模块:中文自然语言处理模块、用户交互模块及初始化模块。系统实现后,作者还将其应用到一个小型新闻管理系统中,对存储在新闻管理系统中的中文信息进行处理和命名实体与知识库的关联实验,验证了系统的可用性。 通过实验,认为在对中文自然语言处理工具及中文百科知识库与Stanbol系统整合后,可以很好地实现Stanbol系统对中文信息的处理。同时,本文工作也是对Stanbol系统进行改造的一次有益尝试,为后续对Stanbol系统的研究及改造打下了良好的基础。
其他文献
本文以教育生态学理论为依据,将情报学高等教育过程看作一个动态平衡的系统过程。本文将管理学中的权变理论引入到高等教育过程中,以系统化、动态化的视角去研究情报学科高等教
广西少数民族历史档案的分布状况及其价值分析研究对于保护历史档案、挖掘潜在价值、传承历史文化、提高档案意识和开展档案工作具有积极的推动作用。
本文将实地调查法
2016年11月15日,伊曼努尔·沃勒斯坦在自己的个人网页上发表了评论2016美国大选的文章,题为《美国大选:终于结束了,但是真的结束了吗?》rn沃勒斯坦指出,他的文章,旨在分析这
在当今全球化的背景下,如何利用好国际和国内两种资源,使中国图书走出去,成为出版界关注的焦点问题。版权输出是中国出版业走出去的重要的方式,同时也是文化交流和输出的重要途径
信息时代,在市场经济的背景下,科技情报机构的发展面临着激烈的竞争和挑战。本文的研究目的就是运用核心能力理论来分析科技情报机构的现状,促进科技情报机构的改革与发展。
知识管理和竞争情报作为提升企业竞争力的管理工具,在知识经济环境下发挥着愈来愈重要的作用。知识经济对企业竞争情报来说,即是机遇也是挑战。竞争情报侧重于对外部环境的关注
[目的/意义]从作者微观个体研究兴趣角度出发,通过对作者合著网络中作者关联关键词集的研究,定量地验证研究兴趣相似是作者合作的一个动机。[方法/过程]收集WOS中检索领域相
我们已经进入大数据时代,大数据正逐渐成为推动社会发展与现代化治理体系构建的新模式与新要素,有效利用海量的数据资源和大数据分析方法与技术为决策者提供决策支持已经成为情
这是一个让人难忘的春节假期,人们被新型冠状病毒肺炎疫情的阴霾笼罩着,少了过年的喜悦,多了不安与担忧,中小学校更因此延期开学.为了响应教育部“停课不停教、不停学”的号
摘 要:社会经济的发展为地质找矿勘查技术的创新注入了新鲜的活力,但就目前来看,由于我国矿产资源多分布在较为偏远的地区,大大提升了地质找矿勘查工作难度,因此为切实发挥出地质找矿勘查工作的积极作用,相关工作人员就应注重对现阶段地质找矿勘查原则以及方法创新的探索上。 关键词:地质找矿勘查技术原则;方法创新 中图分类号:P624 文献标识码:A 文章编号:1004-7344(2018)23-0189-