对象检索中的实体信息查询扩展算法研究

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:qpzm007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究了对象检索中的实体信息扩展算法,现如今对于信息的需求已经逐渐从较为模糊的网页检索演进为对象检索,带动实体信息抽取成为最核心的技术之一,而实体信息扩展则是实体信息抽取技术中一个重要的部分。实体信息抽取的目的在于自动生成包含实体相关属性信息的实体知识库。本文研究的实体信息查询扩展的目的:一是扩充实体查询词信息,在查询词信息不完备的条件下,对实体查询词进行信息扩充,消除查询词歧义,明确查询意图;二是实现针对实体别称等共指信息的扩展,从而将共同指向的不同实体之间的信息得以合并共享。本文的主要工作如下:首先,将对象检索与传统的信息检索进行了分析对比,重点分析了实体信息扩展和传统查询扩展在预处理、词项选择、相关度计算、及匹配方法上的区别和联系,并在此基础上确定了本文的主要研究课题,即基于统计学习的实体信息扩展,以及基于语法规则的实体信息扩展。其次,针对与实体相关度高的词项扩展问题,本文提出了一种基于概率统计的实体信息扩展方法,利用相关反馈技术,结合层次聚类算法,在相关文档集内对实体与词项进行共现相关度挖掘,实现对实体描述信息的扩展。基于该模型,对两千余个实体进行了相关词项扩展,并应用在TREC2012Microblog评测任务中,结果验证了该模型的有效性。最后,针对实体别称、同义词、身份描述等信息,本文研究给出了一种基于语法规则的实体信息扩展方法,通过词法分析预处理,根据针对共指表述的语法特征,对实体表述进行共指消解,实现实体别称等信息的扩展。利用该模型,在TAC2012KBP中的两个子任务中获得良好效果,验证了该模型的有效性。
其他文献
在社会主义经济高速发展的情况下,电力企业若想达到社会用电要求标准,就必须加大建设电网的力度,同时增加投入力度,高度的重视变电站管理维护以及检修工作,提供给供电网平稳
该文介绍了直接数字式频率合成(DDS)的基本原理、特点和应用,并且给出了DDS各组成部分的设计原则.分析比较了几种常用的CMOS DDS集成电路(IC).提出了DDS印刷电路板(PCB)及屏
学位
锌镉渣主要是锌提纯铸锭过程中产生的锌铜镉渣,也是做锌锭过程中的锌净化渣.锌镉渣可以被再次利用,其中的镍和锌都有非常广泛的用途.在综合利用锌镉渣时,锌铜镉渣浸出,除铜.
随着我国经济技术的不断发展,社会对于能源的需求也越来越多,尤其是电能作为一种较为清洁的能源正在人们的生产生活中发挥着越来越大的作用,这对于电能的供给和配送提出了更
近年,区块链技术不断应用于各个领域.本文以精准扶贫审计为例,研究区块链技术促进精准扶贫审计的信息安全的机制,研究发现:区块链技术不仅为扶贫审计实现抽样审计到全面审计
随着我国社会经济的不断发展,科学技术的不断完善与加强,对各种基建的发展也逐步加强,电厂的建设也在大力建设中.电厂的调试和运维工作作为其主要工作重点,电厂设备的维修工
该文对采用先进电路技术实现机载MTT处理机、机载DBS处理机和机载SAR处理机的方 案进行了深入研究.在机载MTT处理机研方面,该文提出了硬件CFAR模块、用于MTT处理的信号处理模
在世界经济的飞速发展和人民生活水平的不断提高的背景下,人们对精神世界的追求也在不断攀升,本文主要指出绿色物流和分享经济发展现状以及存在的问题,并提出我国发展绿色物
学位