跨媒体摘要生成算法与技术研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:leolee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网(特别是移动互联网)的普及,越来越多的人能够随时随地通过计算设备去方便地浏览和分享各种各样的多媒体数据。用户在面对以主动浏览或被动推送形式所获取的海量多媒体数据时,往往容易陷入因数据冗余而将知识湮没的尴尬境地。针对这一问题,合适的文本生成方法成为近年来研究的热点。文本生成的目的在于从海量数据中去芜存菁,提取出有效的信息并组织成便于理解的简短描述呈现给用户。  本研究主要内容包括:⑴在传统的文本生成研究工作中,对数据文本的信息覆盖度和冗余度的衡量一般都处于主题层面而并未深入地探索和挖掘其中隐藏的结构信息。针对不同数据往往具有不同的描述偏好这一广泛存在的特性,提出了一种基于特征组选择的文本生成方法来探索和表达主题下隐藏的细粒度主题侧面信息。这一方法能够学习得到不同类型主题下的特征偏好,并利用这种特征偏好来促进所生成文本信息的高覆盖度和低冗余度。⑵在已有的主题结构学习框架中,主题下隐藏的主题侧面的数量以及描述这些主题侧面所需的特征维度均需要事先设定。然而,不同主题下的主题侧面结构和描述形式往往是多种多样的,所以这种事先设定的参数往往不能很好地适应实际数据。针对这一问题,提出了一种基于非参贝叶斯模型的文本生成方法。该方法针引入了两种非参数先验来根据不同输入数据自适应地学习出主题侧面数量和描述主题侧面的特征维度,并将其整合到统一的贝叶斯学习框架中。这一框架使得文本生成算法能够更加深入、准确地对主题结构信息进行挖掘和利用。⑶跨媒体数据往往具有明显的跨领域来源(cross-domain)特性以及丰富的社交信息。为了更加有效地利用这些特性,针对跨来源的问答数据和社交网络数据提出了一种基于异构社交网络的问答数据学习方法,将随机游走和深度学习框架相结合,从而能够有效地从大规模的异构网络中学习得到不同来源不同类型数据的特征表达。提出的这一方法可以很方便地扩展到更大规模和更多来源的数据上且其学习得到的各种特征表达能够进一步地为文本生成任务服务。⑶除了跨领域来源的特性,跨媒体数据的另一大特性在于数据的跨模态(cross-modal)特性。跨模态的数据给文本生成工作带来了两大困难:一个是“语义鸿沟”,即数据的底层特征与其高层次语义之间的不一致性;另一个则是“异构鸿沟”,即不同模态数据的特征空间之间的不可比性。为了解决这两大难题,提出了一种基于跨媒体语义对齐的文本生成方法,一方面利用深度学习模型来从数据底层特征学习得到其高层语义表达,另一方面引入一个双向损失函数来促进不同模态数据之间的语义对齐。通过这两方面的结合,该方法能够利用不同模态的数据来提高另一模态数据文本的质量。
其他文献
近年来,互联网的飞速发展大大促进了新技术的发展和普及。其中,人工智能技术的进展尤为迅猛,随着算法的不断完善,越来越多的智能设备开始进入我们的家庭生活中。这些智能设备普遍
在模糊专家系统,模糊控制,模糊决策支持系统与模糊模式识别等许多智能系统的开发研究中,常常会遇到许多具有模糊性的不确定信息与数据,为了表示和处理这些模糊的信息与数据,Zadeh
学位
随着电子商务的快速发展,网络购物在人们的生活中扮演着越来越重要的角色。然而随着商品的数量越来越多,用户从海量商品中寻找合适和喜爱的商品反而变得越来越困难,因此需要一种
学位
该文结合江苏省高速公路联网慢费系统,讨论了一些流行的ETC技术,并对这些技术 发进行了分析和比较,并介绍了自动收费系统的设计和实现.同时,文中还探讨了人工收费和自动收费
随着云计算、物联网、社交网络和下一代通讯网络等新兴技术的广泛应用,城市信息化速度正在不断加快,智慧城市正在成为全球城市发展的新方向。智慧城市将传统地理意义上的城市区
计算机外存储设备是计算机体系结构中一个重要的组成部分,它以计算机性能的提高起着越来越重要的作用.但当前的外设却存在着速度慢、不抗震动、易损坏等缺陷.该课题研究的项
属性论从神经科学的实验结果、哲学和逻辑学的基本原理出发,以人类认识的心理过程为主线,以先进的数学理论——范畴论为工具,充分利用人工智能、思维科学、认知科学及计算机科学
该文从知识工程的角度出发,对工程智能CAD 系统中的知识库管理系统进行了研究.工程设计问题具有高度智能性和复杂性,无法使用通用的生产方式系统来进行求解,必须要有专门智能