【摘 要】
:
近些年来,随着人工智能日新月异的变化与发展以及自然语言理解技术的不断突破,人机对话系统因其广阔的应用场景以及极大的商业价值受到大量研究人员的关注。得益于互联网的迅速发展和海量数据的产生,深度学习技术获得了长足的进步,依赖于深度学习的端到端对话系统逐渐成为主流。基于端到端方法的对话系统能够根据输入,直接生成对应输出,减少了人工标注数据的工作量,消除了传统管道方法中的误差累积问题。但是,端到端方法仍存
论文部分内容阅读
近些年来,随着人工智能日新月异的变化与发展以及自然语言理解技术的不断突破,人机对话系统因其广阔的应用场景以及极大的商业价值受到大量研究人员的关注。得益于互联网的迅速发展和海量数据的产生,深度学习技术获得了长足的进步,依赖于深度学习的端到端对话系统逐渐成为主流。基于端到端方法的对话系统能够根据输入,直接生成对应输出,减少了人工标注数据的工作量,消除了传统管道方法中的误差累积问题。但是,端到端方法仍存在一些问题亟需解决,如生成的答案可能非常通用或无意义;虽然有记忆功能,但记忆量有限,记忆时间有限,处理长序列非常耗时,难以应用于多轮对话。本文提出了两种模型以解决上述问题,并基于提出的模型设计实现了一个任务导向型多轮对话系统,具体工作内容可以概括如下:1.针对生成的答案无意义的问题,本文提出了一种混合检索生成方法的任务型对话模型。该模型结合检索模型和序列到序列的生成模型,根据不同的情形,选择不同的模型输出作为应答,保留了检索方式速度快和生成方式应答一致性高的优点,解决了检索模型无法处理与知识库相关性不强的输入的问题和生成模型可能产生无意义应答的问题。2.针对记忆存储问题,本文提出一种记忆网络结合seq2seq的模型。该模型使用编码器-解码器结构,将记忆网络作为编码器,记忆网络加上门循环单元作为解码器,结合记忆网络能够保存上下文语句的信息的特性,以及序列模型能够根据一个序列生成另一个长度不同序列的优点,实现了一种结合记忆网络的序列模型,以提高模型记忆能力,有效结合外部知识库信息,改善传统序列到序列模型记忆量有限的问题,从而提高多轮对话能力。3.设计并实现一个任务导向型多轮对话系统。将本文提出的模型构建为对话引擎,结合服务器与web前端,实现了一个完整的对话系统。Web前端接收用户问题并将答案返回给用户;服务器传递前端与对话引擎之间的信息;对话引擎接收到用户输入后使用训练好的对话模型生成适合的响应并返回。最后,通过对系统的测试与评估,验证了本文提出的模型的有效性与可行性。本系统部分已经交付给银行,正在测试阶段,即将投入银行客服系统中使用。
其他文献
癌症已是世界上夺取人类生命的第二大病症,恶性肿瘤也严重威胁到中国人民的安全。癌症治疗的手段之一是通过外科手术切除肿瘤,医生在膀胱肿瘤切除手术中,尿道壁损出血会产生血液噪声,造成视线受阻,从而影响手术的成功率。本文针对尿道镜检查中血液噪声影响视力的问题,用深度学习的方法从血液噪声中恢复清晰的尿道图像,主要工作如下:(1)训练图像恢复模型缺少数据集,本文分别采用传统的方法和基于深度学习的方法生成数据集
天地一体化网络是我国“十三五”科技创新规划的重要内容之一,在国家战略利益扩展等方面具有至关重要的作用。卫星网络具有拓扑复杂,链路动态变化,资源稀缺,处理能力有限等特点。因此,如何优化网络资源分配,减少资源消耗,对于降低卫星网络的运营成本,提高资源利用率具有重要意义。软件定义网络(Software Defined Network,SDN)和网络功能虚拟化(Network Function Virtu
复杂网络作为物理学中新兴的分支,随着互联网的兴起以及数据的爆炸性增长而受到国内外众多学者的关注。复杂网络是基于图论的一门交叉型应用学科,截至目前已经有较长的研究历史。1988年小世界特性的发现使得对复杂网络的关注上了一个新台阶,而无标度特性的发现更是对其的发展产生了深远的影响。不同于随机网络或人工网络的是,现实世界中的网络的非同质性决定了节点背后所表示的对象的重要性并不是平均分布的。而是有影响的节
通过互联网开展人物画像生成、人物关系分析、人物行为预测等以人物属性、行为提取与分析为核心的研究已成为网络信息挖掘领域的研究热点,预先开展人物网页精准分类能够有效降低工作量,减少噪声,提高分析效率。现有的网页分类方法的着眼点多集中于网页的领域进行分类,例如“艺术”、“商业”、“体育”等,而对于人物网页分类研究相对较少。本文主要针对人物网页分类问题开展研究,在研究分析现有网页分类方法基础上,根据人物网
互联网兴起至今不过30年,已经发展成为一个庞然大物,互联网提供的服务从最初的文本浏览到今天的各种纷繁的功能业务,其核心都避不开文件的传输即下载,文件下载在为用户带来便利的同时也带来了在线盗版文件下载。而且近年来随着我国网络基础设施的快速发展,网速出现了飞跃性的进步,盗版文件的传播也变得更加快速,盗版文件的下载出现了传播量大、有效时间短的特点。基于以上因素,本文提出了一种主要面向盗版下载文件的下载信
随着网络技术的高速发展,网络规模的扩大和应用数量的增加,使得用户对网络的服务质量保障提出了新的要求,亟需高效的路由算法对业务流的服务质量(Quality Of Service,QoS)需求进行保障。但是传统网络架构复杂,难以获取全局视图,限制了路由算法的设计和部署,无法提供理想的QoS保障。而软件定义网络(Software Defined Network,SDN)架构的提出,解耦了控制平面和数据平
随着生活智能化的进程,说话人识别与说话人属性分类在身份认证、公共安全以及智能家居等领域有着越来越广泛的应用,但由于实际应用场景的复杂性,现有基于深度学习的声纹识别和说话人属性分类技术虽然能在静音的理想环境中能够达到较高的识别效果,其对于环境噪声的鲁棒性和识别准确率还有待提高。本文旨在研究具有高鲁棒性说话人识别和说话人属性分类系统,提升其在复杂环境中的准确率,具体研究内容如下:1.提出基于注意力机制
时序数据预测算法已经成为许多社会服务的基础,利用机器学习来对时序数据进行预测是常见的手段,当需要大量计算资源的时候会将计算任务交付给云平台进行处理,云平台为算法提供充沛的算力支撑,然而云平台缺乏灵活性且消耗过多的带宽。为此可将算法下沉到边缘端,边缘端的轻量化可克服云平台的笨拙,但边缘端由于自身硬件的限制,难以提供像云平台那样充沛的算力,导致在进行时序数据预测的时候会出现算力不足或者耗时过长的情况。
互联网技术的快速发展和移动终端的普及向用户们提供了海量的信息资源,用户逐渐习惯于网上购物、看视频、听音乐以及浏览新闻资讯。然而这些丰富的资源也带来了信息过载的问题,使得用户可能需要花费大量的时间以及精力来从海量的信息中检索到感兴趣的内容。如何全面并且精确地帮助用户找到需要的内容成为了个性化推荐系统中的主要目标。向用户们推荐没有参观过的且可能感兴趣的兴趣点(POI)是基于地理位置的社交网络中基本应用
与轮式和履带式移动机器人不同,四足式机器人能更好的适用于各种非结构化地形,具有良好的越障能力,机动性强,具有广泛的应用前景。由于四足机器人自由度高,动力学建模繁杂困难、计算量大,控制算法复杂,难以满足实际使用要求。为此,本文重点围绕四足机器人的动力学建模与控制方法开展研究,主要工作如下:首先在国内外四足机器人常见构型的基础上,提出了一种连杆传动的四足机器人结构方案。在分析传统牛顿欧拉迭代算法的基础