基于神经语言模型的无条件文本生成研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:lxy901123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无条件文本生成的目的是生成与真实文本一样高质量、多形式的文本,而使用最大似然估计训练的自回归(Autoregressive,AR)神经语言模型常被用来作为无条件文本生成器。由于AR神经语言模型存在曝光偏差问题,即训练和推理阶段的输入不一致,所以生成文本的质量差并且多样性低。为了解决曝光偏差问题,生成对抗网络(Generative Adversarial Nets,GAN)被用来微调AR神经语言模型,具体方法是使用鉴别器检测到的偏差信号来指导AR神经语言模型更新。然而,此类语言GAN方法本质上是牺牲多样性来换取质量的有限提升,不仅没有改进AR神经语言模型,反而带来了模式崩塌等问题。另一方面,现有的无条件文本生成评价方法存在缺陷,即不能同时考虑生成样本的质量和多样性两个维度。为了解决无条件文本生成的评价难点,本文提出了一种新的无条件文本生成评价指标——分布偏差(Distributional Discrepancy,DD)。该指标根据生成文本和真实文本之间的分布差异来评估无条件文本生成模型的性能,可以同时完成生成样本的质量和多样性两个维度的评估。由于实际中无法得到真实文本的分布,所以不能通过计算的方式直接精确地得到DD。基于此,本文设计并实现了一种可学习的方法来估计DD,即训练一个基于神经网络的文本分类器,并根据分类器的结果来估计DD。为了观察DD的有效性以及评估表现,本文在真实数据和合成数据场景下进行了实验,使用DD和已有的三个基准指标,对基于长短期记忆(Long Short-Term Memory,LSTM)和生成预训练转换器2(Generative Pretrained Transformer 2,GPT-2)的一组AR神经语言模型进行评估并排序。实验表明,在对这些AR神经语言模型的性能进行排序时,DD的表现明显优于三个基准指标。为了改进无条件文本生成模型,本文提出了一种过滤框架。该框架通过在原始生成模型之后添加过滤器(充分训练的双向鉴别器结合采样过滤算法),过滤掉那些和真实文本偏差大的生成文本,从而使得最终输出的生成文本的分布更接近真实文本的分布。该框架只使用过滤器修改原始生成模型的输出,并没有更新其参数,因此过滤框架能够被用来改进任何结构的无条件文本生成模型,并且避免引入GAN带来的模式崩塌等问题。为了验证过滤框架的性能及适用范围,本文在两个公开数据集下进行了实验,使用过滤框架来改善基于LSTM和GPT-2结构的AR神经语言模型。实验表明,过滤框架的性能始终优于两种AR神经语言模型和语言GAN。
其他文献
非平衡问题普遍存在于各个应用领域,比如医学诊断、文本分类、故障监测等。传统的分类方法未考虑到数据的不平衡性,会导致非平衡数据的分类效果不理想。当前大数据背景下,深度学习作为机器学习的一个新的研究方向,在数据挖掘等领域取得了显著成果。其中的代表算法卷积神经网络具有表征学习的能力,是一种高效的数据挖掘工具。面对非平衡问题,应用卷积神经网络进行分类任务时,其训练过程若受到非平衡因素的不利影响,会降低少数
林麝(Moschus berezovskii)人工饲养繁育始于上世纪50年代末,历经60多年的不懈努力,近20年饲养种群呈现较快的增长,然而,饲养林麝种群的遗传多样性现状及遗传结构尚缺乏充分的研究,因而不利于种群遗传管理及其饲养种群种质保护与利用。本研究从陕西省宝鸡市凤县的逢春麝场、片仔癀麝场、达吉康麝场、留凤关海兴麝场以及汉中市留坝县的太子岭麝场采集365份新鲜的粪便样品,用分子生物学方法扩增林
城市公共交通系统在“以人为本”的指导理念下,对个体出行行为的深入研究,是城市公共交通系统发展的必要条件。智能交通卡数据为个体出行行为的研究提供了丰富的基础数据,但其中出行目的信息的缺失,使更深层次的理解个体出行行为和预测出行需求受阻。随着居民出行需求逐渐多样化,如何经济有效的补充智能交通卡数据中的出行目的成为了研究热点。本文使用智能交通卡数据,提取个体多日出行活动信息,划分个体活动区域,以活动区域
第三章生命回归在《若望福音》生命动态的解析中,我们看到启示父的光荣和大爱是耶稣在世独一无二的工作。父的工作和耶稣的工作之间,存在着一种相互关系。这工作是父所委托;耶稣向世界启示父的目的,就是要使人们"认识"父——献身给祂,而"认识"本身带来了永生。
期刊
随着我国乡村环境日益优化,乡村逐渐成为城市生活的补充,乡村农家乐也不断发展,主要功能不再仅仅是“吃农家饭,看乡村景”的休闲活动,还有民俗文化体验、农产品采摘等经营项目,甚至在乡村农家乐的基础上发展出了乡村酒店、乡村养老中心、共享体验农庄、特色小镇等多种新类型的乡村旅游产品。由此可见,随着时代不断发展,消费者需求的不断变化,未来农家乐的产业功能需要不断变化来适应新的产业形态,其空间形态与结构也必须随
高温超导磁悬浮列车是超导磁悬浮技术的主要应用方向之一,具有无需外部控制即可达到稳定悬浮的特性,相较轮轨列车有节能环保、速度应用区间广等优势,具有巨大的发展空间。低温系统作为超导磁悬浮的核心系统,冷却方法的选取及结构设计直接影响超导块材性能的发挥从而影响列车的运行性能。本文开展了传导冷却方法与液氮冷却方法对块材悬浮性能影响的研究,并提出了传导冷却方法的优化方案。最终针对磁悬浮列车的运行环境设计了液氮
在计算机视觉领域中,密集计数是十分重要的子领域,其目的是通过对输入神经网络的图像进行深度学习,提取深层特征,从而得到图像中计数目标的数量。根据实际研究与应用中所要计数的目标的不同,密集计数又可划分为人群计数,车辆计数等。高速公路拥堵场景下的车辆计数是一大难题,其有着道路情况复杂多变,车辆形态不一,车辆遮挡严重,车辆尺度变化较大等特点。因此,目前通用的密集计数算法并不能取得一个令人满意的结果。本文的
随着磁悬浮技术的快速发展,以Halbach阵列为代表的永磁结构的出现以及具稀土永磁材料的广泛运用,使得永磁电动悬浮系统越来越受到人们的关注。永磁电动式磁悬浮与其它类别的磁悬浮制式相比结构简单,价格低廉,不需要复杂的冷却系统和控制系统。本文将磁悬浮技术应用到传统汽车系统中,基于永磁电动悬浮原理搭建了一种新型磁悬浮汽车原理模型,并展开磁悬浮汽车原理模型工作模式以及动态特性方面的研究。首先基于环形Hal
随着我国铁路事业的快速发展,信号设计行业的工作量也在不断增加。车站信号平面布置图是铁路信号设计的基础,它能够反映车站室外信号设备的布置情况,是后续工程设计的数据来源。铁路信号行业中的车站平面布置图多采用AutoCAD软件进行绘制,该软件是目前应用最为广泛、使用人数最多的计算机辅助设计软件,它提供了基础的CAD功能,可以根据相关数据绘制出图形。传统车站信号平面布置图的设计任务繁重,要实现图形的局部调
学位