基于语义反演的关键词检索

来源 :北京大学 | 被引量 : 0次 | 上传用户:xxssdd55
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关键词检索是互联网中使用最广泛的检索技术之一,也是世界上一些著名互联网站点比如谷歌、维基百科、亚马逊和IMDB等的默认检索方式。传统的关键词检索技术主要是针对无结构化文本的检索,所基于的方法也偏向于单纯的关键词匹配,这些方法只强调了关键词的出现频次而忽略了关键词每次出现时所具有的语义。随着结构化数据的使用和推广,识别文本中关键词所属的语义也变得更加方便。  在本文中,我们利用XML等结构化文档中的“语义—关键词”的结构来记录文档中所有关键词出现时所属的语义。同时,我们还根据语义与语义在数据集中的共现关系,以及他们在语义词典中的相似度来综合衡量不同语义之间的关联度。然后,我们通过一个综合考虑关键词—语义之间的对应,以及语义与语义之间的关联度的语义反演图模型,来推测用户给定查询的查询意图,也即每个关键词的目标语义。我们把语义反演图模型运用到基于XML文档的关键词检索系统SEEK中,并通过对比试验证明了SEEK的检索效果要优于大部分传统的关键词检索算法。此外,我们还利用SEEK检索系统参加了国际检索比赛INEX2010年和2011年的比赛,均取得了优异的成绩。
其他文献
云计算是一种新的网络化IT服务模式,它组织大规模的计算和存储资源向用户提供便捷、经济、全面的服务,已成为学术界、产业界和政府部分关注的焦点。虚拟化技术是云计算中的关键
无线传感器网络(Wireless Sensor Networks,WSNs)因其巨大的应用前景和商业价值而受到学术界和工业界的广泛关注,在民用和军事上已经有了广泛的应用。居民区抄表(水表、电表
测试用例的有效生成是提高测试自动化程度关键的一步。近年来,人们开始尝试将智能搜索算法引入测试用例自动生成的领域中,取得了不错的成果。目前,主要的研究工作都是通过改
随着对现代微处理器高性能和高能效的需求日益提高,如何在低功耗和低硬件复杂度的约束条件下进一步提高微处理器性能,已经成为微处理器设计领域所面临的重要问题。为应对这一挑
对知识表示的学习一直是自然语言处理的研究目标。深层学习架构为我们提供了一种自动学习分布式特征表示的方法。通过对词的分布式特征表示的学习,基于深层学习架构的深层神经
电子设备的可靠性取决于其所采用的软硬件系统,归根到底,是其可靠的硬件基础——集成电路。集成电路的发展同时也促进计算机技术和通信技术的飞速发展,为此,保证集成电路拥有可靠
超高层建筑的施工是一个复杂的系统工程,涉及到大量的人员、设备和材料。如何在保证施工质量的前提下,尽可能的缩短工程施工时间以节约施工成本,这是每个建筑施工企业都非常关注
XML以其强大的功能,在计算机领域得到了广泛的应用,已经成为信息描述和交换的一种标准技术。XQuery被设计用来查询XML数据,树模式查询作为XQuery查询的核心,其查询效率问题成
OLAP(On-Line Analytical Processing)是一种强有力的数据可视化工具,它专门设计各种用于支持复杂分析的操作,使得管理决策人员能够对数据仓库中海量数据进行深入观察。但是,OLA
随着我国计算机网络的快速发展,黑客入侵攻击事件发生的概率随之增大,对网络安全的研究也越来越引起人们的重视。而计算机系统和网络设备上广泛存在的漏洞是成为被黑客攻击的最