开放领域聊天机器人对话生成算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:xiaosheng07
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网和社交媒体的快速发展,开放领域聊天机器人在生活中发挥着广泛作用,它不仅可以解决用户的交流需求,也能降低企业为用户提供服务的成本。因此研究开放领域聊天机器人对话生成算法具有一定意义,也是当下的热点研究之一。随着深度学习的发展,基于Seq2Seq模型的开放领域聊天机器人取得了巨大进步。然而该对话生成模型存在一定缺,例如过大的词表会降低模型对话效果、缺乏对话的多样性以及难以进行多轮对话。针对上述问题,本文主要工作如下:(1)基于Seq2Seq模型,使用BPE分割单词,降低对话词表大小,提升对话生成效果。由于对话生成模型的网络输入大小有限,而人们日常对话过程中会出现稀有词,如果直接扩大词表或使用UNK替代词表之外的词都会降低对话生成效果。本文基于Seq2Seq模型,使用BPE分割单词,将单词分割为具有共同结构的子单元,从而降低词表大小。与未经处理的方式相比,在Seq2Seq模型下,BPE处理后生成的对话具有更高的BLEU值,对话生成效果更好。(2)基于对抗强化学习的对话生成算法。由于对话由离散的单词组成,导致生成对抗网络无法直接用于对话生成。本文利用强化学习的策略梯度更新生成对抗网络中生成器参数,从而使生成对抗网络可用于对话生成模型。为了使生成器在训练过程中更容易收敛,本文使用监督式的学习方法辅助生成器网络更新。对比Seq2Seq模型,对抗强化学习对话生成算法具有更好的对话多样性。(3)改进HRED模型,使用最大互信息作为对话生成模型的损失函数,提升多轮对话能力。限制于网络结构,Seq2Seq模型难以根据上下文历史信息进行多轮对话,同时Seq2Seq模型缺乏对话多样性也将导致对话过早终止。本文改进HRED模型,使用最大互信息作为该模型的损失函数,从而降低对话模型出现无明确意义回答的概率,增加对话的多样性,进而提升模型的对话轮数。对比Seq2Seq和HRED模型,改进的HRED模型能进行更多轮数的对话。
其他文献
本次翻译实践的文本选自《惬意独居,从容老去》一书,作者从亲身经历出发,介绍了日本老年人的独居生活方式,其中也揭示了老年社会中存在的问题。中国已逐渐步入老龄化社会,独居老人的数量不断增加。如何过好独居生活,怎样抵御心理上的孤独感,是他们正在面临的难题。通过此次翻译实践,笔者认为中国的独居老人也能从本文本中获得启发,以积极乐观的心态面对今后的人生。本次翻译实践的文本,从内容上看属于实用生活类书籍。从体
<正> 母猪无乳综合症,俗称产后热,又叫泌乳失败或毒血性无乳症,是当今规模化养猪场分娩母猪哺乳期的常见病,临床特征主要是厌食,精神萎靡,不愿让仔猪吮乳,乳房无乳及泌乳不足
目前对于悬索桥索夹设计和紧固施工的关注点主要是在索夹自身设计的强度和索夹螺栓设计张拉下索夹设计的抗滑承载能力等宏观层面的问题,要求索夹拥有足够的抗滑承载能力安全储备,而较少关注可能造成索夹滑移这一现象的本质。造成索夹滑移这一现象是由多方面原因造成的,其主要原因是索夹作用下主缆细部钢丝股之间的受力状态非常复杂,索夹下的主缆变形不规则,因此本文希望通过对索夹作用下主缆内部钢丝之间的相互作用,以及索夹下
图像的语义分割(Semantic Segmentation)技术已经成为计算机视觉领域的热点研究方向,其研究成果能够有效地应用到地图重建、人脸识别以及无人驾驶等领域中。目前,现有的语义分割网络较多,随着语义分割技术的不断发展和完善,在公开数据集上的分割精度也不断提高。随着遥感图像获取途径的增多,需求量越来越大,如何有效提高高分辨率遥感城市道路图像的分割精度是本文研究的主要问题。本文在研究了遥感城市
随着我国新的民办教育促进法和各类教育政策法规的出台,民办国际学校迎来蓬勃发展期。当前,随着经济的不断发展以及地方政府的招商引资,一线城市的民办国际学校开始不断地向三、四线城市进军。A学校2016年设立,2019年正式开学,致力于成为泉州市最高端的十五年一贯制民办国际学校。A学校作为泉州市第一个民办国际学校,自开学以来面临着来自当地各个竞争对手的挑战和压力。面对复杂多变的外部环境,A学校首先要解决的