多轮交互问答机器人研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:yourwp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着大数据技术和计算能力的不断提升,人工智能技术发展迅速,人工智能类产品也迎来了广泛的关注和研究,其中结合自然语言处理技术的智能问答机器人系统的需求也随之增多。目前如微软小冰等基于开放领域的聊天机器人已经逐渐投入市场,解决了部分情感助手的需求。然而,针对特定领域的问答系统需要专业人员的参与,问答回复准确率要求更高,虽然有着日益迫切的需求但是离真正的使用还有一段距离。多轮交互问答机器人能够根据用户的输入信息理解用户真正需要完成的意图,并且帮助用户完成任务型的指令,例如高校教育领域内的报考咨询,空管调度领域内的航班查询等,目前有着广泛的应用场景。多轮交互问答机器人能够极大程度地代替人工客服,回复速度快,回复准确率有保证,能够提升用户的咨询体验。本文所提出的多轮交互问答机器人为面向特定领域的任务型问答,支持用户自定义配置对话知识,采用基于管道的方式将多轮交互问答划分为语言理解、对话管理以及语言回复三个部分,其中本文的研究重点为应用自然语言处理技术和深度神经网络提供多个语言理解问题的解决方案。首先采用文本纠错技术对于用户的输入进行修正,然后通过对文本进行中文分词,词向量等数据预处理技术获取分词和词表示结果。接着通过对文本进行意图识别和实体识别使得机器人能够理解用户输入的潜在信息,通过对获取的语言理解信息和用户的对话状态上下文信息进行对话管理得到当前时刻机器人系统需返回用户的策略并生成具体回复返回给用户。针对各关键问题,本文首先构建了基于注意力机制的Seq2Seq模型来完成对于输入文本的纠错方法并实现。然后针对中文分词进行分词方法的介绍,通过对jieba分词源码进行分析得到分词错误的潜在原因并提出引入正则词典进一步修正分词结果。然后将意图识别问题分为面向通用语料以及面向领域意图知识两种问题,设计并实现了基于文本图卷积的深度神经网络意图模型,提出基于特征提取相似度匹配的意图识别方法,构建基于元学习思想的归纳网络的意图识别模型并实现。然后根据实体识别输入语料的不同按照序列标注问题以及字典匹配问题分别构建了基于词格的LSTMCRF模型和基于字典的最大正向关键词匹配方法。然后设计并实现了多轮交互问答机器人系统,设计多轮交互的问答流程,构建基于插槽填充思想的对话管理策略,并设计实现系统的功能接口,通过Flask框架打包服务,各功能模块间以RESTAPI的方式提供通信,然后使用异步通信方式部署系统,提升了系统的通信效率和并发能力。最后,对系统从关键问题解决算法进行对比实验分析结果,对系统的主要接口结果进行展示,以接口的形式进行响应时间,压力测试等性能实验。通过算法和系统两个方面的测试结果证明本文所实现的多轮交互问答机器人系统能够满足实际使用要求。
其他文献
氢键是一种独特的非共价作用力,具有一定的方向性和强度,氢键的形成有可重复性和高度可逆性,被用于解释很多生物、物理、化学和材料现象。密度泛函理论(DFT)在没有借助D3、D4色散校正或NL非局域校正以前对分子间相互作用不准确,DFT-D和DFT-NL方法如B3LYP-D3BJ,PBE0-D3BJ,ωB97X-V,DSD-BLYP-D3BJ等方法对分子间相互作用计算越来越精确;而强氢键体系通常伴随不同
资助是手段,育人是目的。目前,国家在高等教育阶段建立起国家奖学金、国家励志奖学金、国家助学金、国家助学贷款(包括校园地国家助学贷款和生源地信用助学贷款)、师范生免费教育、退役士兵教育资助、勤工助学、学费减免等多种形式有机结合的学生资助政策体系,从制度上保障“不让一个学生因家庭经济困难而失学”,有利于培养德智体美劳全面发展的社会主义建设者和接班人。本文采用文献研究法、问卷调查法和访谈法,通过对高校资
信赖域算法因其较强的全局收敛性等优点,在求解非线性优化问题时被广泛使用。近年来关于信赖域算法的研究以信赖域模型的构造及信赖域子问题的求解最为热门。二次模型因其简单的计算形式脱颖而出,成为应用最广泛的信赖域模型之一。在求解二次模型子问题的过程中,传统折线法与基于微分方程模型折线法展现出了高效、快捷的优势,为研究信赖域算法开拓出一条高效的路径。本文基于最优曲线的微分方程模型,分别在Hessian阵正定
无人机(unmanned aerial vehicle)是一种可重复使用的,机上无人类操作员的航空飞行器。随着无人机的各项技术逐渐成熟以及对多无人机系统的复杂通信需求的增加,学者提出了飞行自组网的概念。飞行自组网的基本思路是通过自动连接建立一个通信网络,无人机节点之间能够互相通信、交换数据。同时不完全依赖地面基站和卫星等基本通信设施。随着飞行自组网的应用在军用和民用领域的逐渐发展,对飞行自组网的接
接口电路是连接传感器与运算电路的过渡电路。为了获得和转化测量的湿度值,使之成为有用的电信号,就必须对传感器的接口电路进行研究。全数字式接口电路原理简单结构不复杂、静态电流较小功耗较低、集成度较高节省版图面积,在各类半导体产品中有着广泛的运用。本文使用Cadence Virtuoso 617软件,设计了一种基于tsmc 0.18μm标准CMOS工艺的电容式接口电路,根据国内外发展现状提出本文的设计指
随着移动互联网以及5G网络技术的发展,电子设备接入互联网的门槛逐渐降低,大量的设备得以接入计算机网络。然而随着大量设备产生的大量数据使得作为数据汇点的中心网络成为整
随着柔性电子器件在医疗、航空、卫星和国防等领域的广泛应用,单层二硫化钼因其极低的面外刚度和可调控的带隙特征可以完全克服制约柔性电子器件发展的两大瓶颈,被誉为新世纪引发纳智能电子领域革命性突破的重要材料。目前,单层二硫化钼的力学的研究已经取得一定成果,但是对二硫化钼失稳力学的研究相当有限,这极大的制约了二硫化钼在柔性电子器件领域的应用。本文基于理论分析和分子动力学模拟对单层二硫化钼失稳力学性质进行系
众创空间已经成为国家和地方政府工作的着力点,在国家政策的支持下,全国各地的众创空间如雨后春笋般的发展起来。但是众创空间数量在激增的同时,也出现了只求数量不求质量的
下肢外骨骼机器人作为目前热门研究技术之一,在增强人体运动能力、辅助下肢疾病患者康复训练等方面起着重要的作用。而如何合理地对下肢外骨骼运动轨迹实现规划与控制是解决
在大数据时代,单纯地从大量图像资源中搜索所需的图像已经无法满足人们的生活需求,如何根据人类的语言描述创造出适应特定需求的图像受到了广泛的关注。近年来,随着生成对抗网络的快速发展,文本生成图像任务取得了重大突破。然而,文本解析的困难以及图像和文本之间存在的语义鸿沟,导致文本生成图像仍然难以得到令人满意的效果。在文本生成图像任务中存在两个主要挑战,一个是视觉真实性,根据有限的文本描述很难生成具有丰富细