论文部分内容阅读
随着互联网(特别是移动互联网)的普及,越来越多的人能够随时随地通过计算设备去方便地浏览和分享各种各样的多媒体数据。用户在面对以主动浏览或被动推送形式所获取的海量多媒体数据时,往往容易陷入因数据冗余而将知识湮没的尴尬境地。针对这一问题,合适的文本生成方法成为近年来研究的热点。文本生成的目的在于从海量数据中去芜存菁,提取出有效的信息并组织成便于理解的简短描述呈现给用户。 本研究主要内容包括:⑴在传统的文本生成研究工作中,对数据文本的信息覆盖度和冗余度的衡量一般都处于主题层面而并未深入地探索和挖掘其中隐藏的结构信息。针对不同数据往往具有不同的描述偏好这一广泛存在的特性,提出了一种基于特征组选择的文本生成方法来探索和表达主题下隐藏的细粒度主题侧面信息。这一方法能够学习得到不同类型主题下的特征偏好,并利用这种特征偏好来促进所生成文本信息的高覆盖度和低冗余度。⑵在已有的主题结构学习框架中,主题下隐藏的主题侧面的数量以及描述这些主题侧面所需的特征维度均需要事先设定。然而,不同主题下的主题侧面结构和描述形式往往是多种多样的,所以这种事先设定的参数往往不能很好地适应实际数据。针对这一问题,提出了一种基于非参贝叶斯模型的文本生成方法。该方法针引入了两种非参数先验来根据不同输入数据自适应地学习出主题侧面数量和描述主题侧面的特征维度,并将其整合到统一的贝叶斯学习框架中。这一框架使得文本生成算法能够更加深入、准确地对主题结构信息进行挖掘和利用。⑶跨媒体数据往往具有明显的跨领域来源(cross-domain)特性以及丰富的社交信息。为了更加有效地利用这些特性,针对跨来源的问答数据和社交网络数据提出了一种基于异构社交网络的问答数据学习方法,将随机游走和深度学习框架相结合,从而能够有效地从大规模的异构网络中学习得到不同来源不同类型数据的特征表达。提出的这一方法可以很方便地扩展到更大规模和更多来源的数据上且其学习得到的各种特征表达能够进一步地为文本生成任务服务。⑶除了跨领域来源的特性,跨媒体数据的另一大特性在于数据的跨模态(cross-modal)特性。跨模态的数据给文本生成工作带来了两大困难:一个是“语义鸿沟”,即数据的底层特征与其高层次语义之间的不一致性;另一个则是“异构鸿沟”,即不同模态数据的特征空间之间的不可比性。为了解决这两大难题,提出了一种基于跨媒体语义对齐的文本生成方法,一方面利用深度学习模型来从数据底层特征学习得到其高层语义表达,另一方面引入一个双向损失函数来促进不同模态数据之间的语义对齐。通过这两方面的结合,该方法能够利用不同模态的数据来提高另一模态数据文本的质量。