基于文本理解的自动问答算法的研究与实现

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:wllzjw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本理解当前是自然语言处理领域极具挑战性的任务,其关键目标是使得机器具备类似于人的阅读能力,让机器算法模型在理解文本内容的基础上,正确给出与文本内容相关的问题的答案。对于文本内容的理解能力的提升,将会对于信息检索、对话系统、智能客服等应用领域有关键性意义。文本理解技术的发展成熟,将会彻底改变人机交互的体验,实现真正意义的智能化。相比于选择填空型文本理解任务,片段抽取型的文本理解任务更具有挑战性和代表性,目前正在受到越来越多的重视。本文契合当前的研究潮流,也以片段抽取型的文本理解任务作为研究重点,探索文本理解领域的新技术和新方法。当前的大规模文本理解任务数据集使得构建复杂的深层次的神经网络模型成为可能,本文将采用深度学习方法,构建文本理解任务模型对原文、问题进行抽象表示并预测对应的答案。当前的文本理解模型主要关注于词维度的语义匹配,返回原文中与提问内容语义相关性最大的部分作为答案。这种策略一般情况下能够正确回答提问,但是由于没有考虑提问句子的整体语义,可能导致模型不能理解真正的提问意图,最后返回错误的答案,即与提问句子中某部分内容相关性最大的原文片段并非是整个提问句子的答案。本文提出了提问语句语义总结机制和原文内容语义过滤机制,以使得模型能够更准确地理解提问意图。本文提出的模型在验证数据集上有明显的提升效果,答案的精确匹配率提升了 1.1%,答案的模糊匹配率提升了0.7%。另外在基于文本理解的自动问答算法的研究基础上,本文实现了一个自动问答算法原型系统以展示我们的研究成果。
其他文献
论证了巴斯加(Pascal)线的两条性质:在巴斯加定理中的60 条巴斯加线,每4条交于一点——对边交点;属于同一对边交点的4 条巴斯加线,分属两个成射影对应关系的同底一维线束。布利安桑点也有类似
民房附近进行工程爆破时,爆破地震波对民房具有破坏作用。作用于房屋的爆破水平地震力易使砖砌房屋受剪力产生破坏。应用反应谱理论,得到了爆破水平地震力和房屋剪力的计算式
依据外商投资动机把FDI划分为四个基本类型,借助净现值和资金循环原理将汇率水平和汇率预期对四类FDI的影响分别建模,利用2007—2012年的月度数据进行协整检验和格兰杰因果关
本文译自苏联列宁格勒矿井设计院所编“溜槽部件计算表”,全部共四节,这后面的二节是专家推荐译出的.
期刊
k近邻多标签算法(ML-k NN)是一种懒惰学习算法,并已经成功地应用到实际生活中。随着信息量的不断增大,将ML-k NN算法运用到大数据集上已是形势所需。利用聚类算法将数据集分
在经济快速增长与资源环境矛盾冲突日益加剧的情况下,政府在协调经济、社会、环境协调可持续发展方面承担着重要责任。环境与经济的协调可持续发展立足于科技进步,对地区科技
德育是学校教育的重要组成部分,是培养全面发展的社会主义建设者和接班人的重要途径,特别是《关于进一步加强和改进未成年人思想道德建设若干意见》的实施,切实加强了学校的
两汉儒家形成的以天人感应、阴阳五行、灾异祥瑞等为主要内容的"天命观",对中国封建王朝的政权合法性具有深远的影响。它不仅为君权神授、君权至上和封建王朝大一统格局奠定
昌马断裂带是是青藏高原北部一条活动强烈的左旋走滑断裂带。它表现为重力、航磁、地壳厚度的综合异常梯度带,属于断面陡、切割深的超岩石圈断裂。昌马断裂带由12条长4公里至18公里