基于汉语框架语义网的信息抽取技术研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:whpzmfwy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着因特网的普及和发展,社会的信息总量呈指数级增长。用户要精确地找到所需信息变得非常困难,往往面对着从搜索引擎中查找出的大量的信息而不知所措。为此,人们希望可以得到一种高质量的信息抽取方案,提供准确、简洁的信息来源,而不至于在信息的海洋中苦苦查找。信息抽取的主要任务是把信息点从各种各样的文档中抽取出来,然后以统一的形式集成在一起,从而更使用户在海量的信息中迅速准确地获得所需信息。信息抽取技术是智能信息处理的重要研究课题之一,有着广阔的应用前景。  本文首先介绍了信息抽取的研究背景、发展状况,研究了信息抽取的主要技术,并分析了信息抽取的研究意义。由于中文文本机器理解工作还处于起步阶段,不能达到应用的水平,基于这一不足之处,利用CFN在语义信息标注方面的优势对文本加入语义信息,使文本处理粒度变细,以提高抽取质量。于是提出了一种信息抽取的方法---基于汉语框架语义网的信息抽取。  本文通过将CFN和信息抽取技术相结合构造了一个基于汉语框架语义网的教材内容提要信息抽取系统。此方法以文本的语义特征向量作为信息抽取的基础,通过神经网络方法构造的包装器对语料进行训练学习生成抽取规则.最后结合目标模板抽取出所需信息。这种方法避开语法分析,对语义元素搭配形式相对规范的领域具有一定的普遍适用性。实验结果表明,基于汉语框架语义的信息抽取方法具有相对较高的准确率。
其他文献
该文围绕分布式数据库系统所面临的分布事务管理的问题进行讨论,其主要内容如下:1.基于UNIX操作系统,介绍了实现DDBS所需要的UNIX及DB_Library软件开发平台;2.深入讨论了分布
该文叙述了虚拟座舱系统的总体设计方案,并详细分析了硬件系统和软件系统的特点和功能,组成了基于PC机网络、实用且功能完善的系统平台.该文对规则与非规则形体的建模算法、
高温金属渗碳炉计算机控制系统是一部机电一体化的现代化金属渗碳热处理系统,具有全自动、高柔性、工艺重复性好等特点,依据高温金属渗碳的理论和统计过程控制理论方法,利用
该文的工作就是设计一个自然语言的接口系统,建立起自然语言到图形的转换.这是一个基于汉语语义结构文法的自然语言理解模型.其中最主要的工作是关于图形的自然语言的深层语
该文就是针对故障诊断所做的智能化研究,设计了一个实用有效的基于ATE的故障诊 断专家系统.并对此专家系统的每个部分做了详细具体的说明和分析.在该文的研究过程中,首先分析
该文首先简单介绍了PVM系统的工作特征和运行原理,然后根据并行计算的任务级的并行性,提出动态子任务的并行计算模式,即子任务在并行计算的过程中运态生成.对于动态子任务的
在中密度纤维板的生产制造过程中,调胶是一个至关重要的工序。我国MDF生产中调胶技术落后,原胶和各种辅助添加剂的配比不准确,造成产品质量不合格、浪费原材料等不良现象,给企业
该文介绍了由作者负责研制的烟丝加香计算机模糊控制系统的软、硬件设计与实现.该文在分析两类常用高精度控制方法(双模糊PID控制和粗-精模糊控制)原理和特点的基础上,结合烟
星载实时微内核操作系统是装载在小卫星自主控制计算机系统上的用以控制卫星各分系统协调工作、保障卫星完成飞行任务、维护正常模式及故障模式运行的管理核.由于卫星运行在
该论文是以PZ8905火箭弹射击系统动态仿真系统为工程背景,论述PZ8905火箭弹射击系统动态仿真的图形用户界面研究,即为203所研制的PZ8905火箭弹射击系统的飞行全过程 ,以及各