面向事件的时序摘要技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:liongliong526
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实生活中一旦发生重大公共事件,人们立即被源源不断的来自新闻媒体的相关报道所湮没,无法准确地掌握事件梗概与当前热点。面向事件的时序摘要以特定事件为摘要对象,从在线的时序文本流中不断抽取与特定事件相关的重要新鲜句子,并按序加入至事件摘要集合的摘要过程。该任务旨在高效监测用户感兴趣的事件在时间轴上的演变。本文将此任务根据其流程拆解成为两个子问题(在线事件检索问题、面向事件的摘要句子选择问题)分别进行研究。  在线事件检索是针对特定事件,按时间序迭代地在每个时间单元的小批量数据集中进行事件检索,得到每个时间间隔的重要事件相关文档。高质量的检索结果是后续高精度摘要的必要条件。针对此任务,我们尝试使用两类图(事件关键词共现图、融合事件类型的二部图)对事件建模,提出了一种基于事件图的在线检索框架,弥补了传统方法未考虑事件本身特性的缺陷。案例分析表明本文的事件查询模型具有低歧义、事件显著的特点,且事件图能够随事件演变而变化。实验结果表明,上述方法针对事件查询,特别是模糊的事件查询,能够显著提升检索精度。  面向事件的摘要句子选择以在线事件检索在每个时间单元的文档检索结果为输入,挑选文档集中与事件相关的新鲜句子补充至时序摘要集合。该过程直接影响事件时序摘要集合的整体质量。针对此任务,我们使用子模函数摘要框架,以最大化摘要集合的词覆盖为优化目标,融合单词的事件相关性与新颖性两方面因素来度量单词在当前时刻的重要性。实验表明本文方法在准确率、召回率、时效性等方面均优于基准方法。  综上,本论文通过在线事件检索与面向事件的摘要句子选择两个步骤,实现了提升事件时序摘要效果的总体目标。
其他文献
根据美国能源部的报告,预计E级超级计算机系统规模将达到十万节点,如何将如此众多的节点有效互连起来,以充分发挥整个系统蕴含的计算性能,成为互连网络亟待解决的问题。面对严峻
学位
近些年来,功能丰富的智能移动终端越来越普及,它的功能越来越多,功耗越来越大,续航时间越来越短。即使是千毫安时的锂离子电池也很难在用户连续正常使用情况下维持12小时。既然电
随着计算机运算速度和网络带宽的快速提高,通过互联网向用户交付硬件资源的云计算模式成为趋势。数据中心服务器的部署和管理是制约云计算模式发展的主要问题。系统虚拟机技术
该文详细论述了"红外光束可燃气体探测器"的探测原理,提出了系统的设计思想,并对系统关键技术所包括的硬件和软件设计作了详细的说明.在该文中,笔者还就系统的标定原理和方法
BitTorrent技术做为P2P技术中的佼佼者,将P2P的思想演绎的淋漓尽致,得到了极其广泛的应用和普及。当前的BitTorrent应用主要是电影、软件等大文件的上传下载,一般占用带宽时
近年来,复杂场景下视频监控系统中的多目标检测技术成为计算机视觉领域关注的热点研究方向。由于复杂场景下各种因素的影响,在对视频图像目标检测过程中会出现检测不全、过检
一词多义是自然语言的一个常见现象,人类基于已有的语言知识和词所处的语境为词进行消歧义。然而,计算机对于词的语义辨别却是一个比较困难的问题,首先,计算机需要得知完整的消歧
普适计算的核心目标之一是实现信息空间与物理空间的融合。计算将不再限定于传统的桌面计算机和服务器,而是利用各种智能终端进行信息的采集和处理,并通过互联通信,使设备之
学位