基于检索式和生成式相结合的聊天机器人研究与实现

来源 :沈阳师范大学 | 被引量 : 0次 | 上传用户:sunshinexpsister
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新时代的不断发展,计算机技术不断进步,人工智能、大数据等技术高速的发展。深度学习广泛应用于自然语言处理、中文分词技术、词向量技术等领域。同时大量的智能音箱和在线客服进入人们的生活。聊天机器人越来越受欢迎,拥有极大的市场发展潜力。当前在聊天机器人的开发模型设计中,最普遍的深度学习设计方案就是Seq2Seq模型,但是用传统的Seq2Seq模型直接设计聊天机器人,总是会出现许多问题。如无法进行多轮次对话、经常产生无意义的“安全回复”等缺陷等各种问题。对传统模型方案Seq2Seq出现的不足,构建一个全新的聊天机器人对话模型,将双向长短时记忆网络(Bi LSTM)、注意力机制(Attention)、传统Seq2Seq模型和Beam Search算法相结合得到的新的聊天机器人对话模型,同时在此基础上加入一个检索式对话模型。通过生成式对话模型可以跟用户进行日常的闲聊,而检索式模型可以对用户的消息进行检索相似度最好的句子来进行准确的回复。具体的研究工作如下:首先研究了中文自动分词、词性标注和词向量等各种关键知识。在对词语进行表达时,如果两个词语之间意思非常接近,那么简单的采用传统的方式很容易形成歧义。当面对处理数量极大的数据时,会出现向量维度过大的问题。通过自动分词最大限度的消除词语的歧义带来的误差。并使用语言模型将用户输入的文本信息转换成词向量,使得词向量带有语义信息。然后分析了传统Seq2Seq模型在处理长序列问题时丢失部分语义的问题,提出了一种将注意力机制与双向长短时记忆网络模型相结合的方法。在过去的模型中编码器和解码器之间只使用一个长度固定的向量。通过应用注意力机制将编码器输入的消息的中间输出结果保留下来,让模型有选择的学习,当模型进行信息输出时关联输入和输出序列,这样即使是较长的问题依然可以保证信息的完整性。并在最后结合Beam Search算法减少无意义的“安全回复”,让回复更加有效、多样。同时对比LSTM与Bi LSTM得出,如果采用Bi LSTM可以实现语义的双向预测,这样也可以有效的解决了部分语义丢失。而LSTM无法对信息从后到前进行编码。同时在生成式回复模型的基础上结合一个检索式回复模型,针对高校相关信息回复,检索式回复模型更加准确。使聊天机器人同时兼顾日常闲聊和特定领域的信息获取功能。最后实现了一个运行在微信公众号的聊天机器人。将本文提到的模型接入到微信公号平台中去,能够让用户操作方便,符合平时使用习惯。只需要关注微信公众号就可以同聊天机器人进行相关的信息获取和日常闲聊的交流。
其他文献
教育行业的不断发展,为小学校园教育活动提供了更多的帮助,在原有的基础上实现了教育质量的飞速提升。而小学阶段是小学生正式接触集体化学习环境的关键时期,同时也是帮助学生树立正确"三观"的黄金阶段。以小学音乐课程教育活动为例,将德育思想教育和课程日常教学相融合,已然成了音乐课程教学工作未来长期发展的必然趋势。
小学在培养学生全面素质时,强调了学生德智体美劳各项素质的综合发展。学生在知识学习时,不仅要完成知识记忆,还需要在教师与学校的引导下,树立正确的道德素质观念。小学作为学生接受教育的初始阶段,必须帮助学生奠定良好的道德素质基础,因此,在小学音乐课堂中融入德育内容也同样重要。教师在讲授音乐知识时,可以借助音乐的情感渲染能力提高德育质量,学生在学习德育内容时可以对音乐知识有更深刻的理解与认知。
期刊
德育教育是小学生全面发展的重要组成部分,是新时期学生核心素养培养的重要内容。在小学音乐课程教学中,富含有丰富的德育元素,将这些元素充分挖掘出来,提升学生德育教育水平,是小学音乐教学活动开展必须要重视的问题。本文在简要概述小学音乐教学德育渗透意义基础上,分析德育教育面临的实际问题,结合实际提出对应的渗透途径,以此为相关教学活动开展提供参考,为提升学生德育水平起到积极的促进作用。
音乐教育,育人是目的,审美是核心。笔者作为小学音乐教师,重点从以下几个方面探讨在音乐教学中如何有效渗透德育因素。第一,寓德育于音乐素养培养之中。小学音乐课堂中的每个环节都可以渗透德育,从学生课前节拍游戏、师生互相问好、坐站姿势,到基本训练中的发声练习、节奏训练等,均可培养学生和谐统一的良好心态。例如,音乐游戏中,指导学生用手势表现不同的唱名,用声音唱出高低,这是教师和学生进行音高、音准调整的
期刊
"赣教云"是江西省中小学线上教学平台,它的出现不仅能够帮助教师解决许多课前、课中、课后的问题,还能够为学校和学生家庭之间提供一个及时有效的沟通交流平台,使学校情况能够及时传到家长手中,同时家长在教育学生时遇到任何问题都能够及时反馈到学校,通过学校和老师群策群力帮助家长及时解决问题。除此之外,"赣教云"平台还能够提供许许多多的智能化教学资源和模式,能够极大地解决教师语文课堂氛围沉闷和学生学习积
期刊
光纤传感技术作为感知和获取信息的关键技术发展迅猛,光纤传感器不易受到电磁干扰?灵敏度特别高?体小质轻?耐腐蚀,在工农业生产,桥梁?隧道建筑,生物医药?石油管道运输等行业广泛的发挥作用?而光子晶体光纤(Photonic Crystal Fiber,PCF)的出现为传感器发展提供了新的方向,低温度敏感性?设计的多样性使其在传感领域被广为关注?本文首先介绍了光纤传感技术的研究背景及意义,并简要分析了目前
粮食现货交易具有交易数量大、价格波动大、交易风险大等特点。而最近几年我国粮食电子商务市场凸显出了“主体多重关联、交易模式多样、风险复杂多变”的典型特征。但是,传统的监管模式为单一监管模式、垂直监管模式和单一的服务模式,因各个平台间数据共享性差,关联协作性差,组织协调性差,模式粒度多样性差,导致粮食现货交易市场交易过程可信性低,粮食现货交易双方主体查验难,粮食现货交易过程监管可靠性低,粮食现货交易风
随着科技的日益发展,计算机视觉的技术逐渐步入了每个人的工作与学习之中。在计算机视觉领域中,使用机器学习的方式来识别人类特征是当下的研究热点和难点之一。行为识别技术在日常生活中屡见不鲜,在生活中和工作中呈现愈发普及之势。例如在人机交互、自动驾驶、工农业的自动化监测等方面有着非常长远的发展前景。在行为识别中,迁移学习和半监督学习是在该领域下较有效的两种机器学习方法,可以利用已掌握的数据特征来使计算机自
图像是人们在社交平台交流的主要方式,但图像在传播过程中很容易受到生成设备和传播途径的影响,造成像素受损,所以针对图像的研究一直是计算机视觉的重要领域。生产对抗网络自2014年出到现在为止一直是机器学习热点内容。生成对抗网络最明显的优点是它是一个迭代的生成神经网络模型,主要包括了两个神经网络,分别是生成器模型与判别器模型。生成器的优点是很容易生成更多的深度模型,缺点是生成器的目的是模仿某一个目标以得