基于文本理解的自动问答算法的研究与实现

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户：wllzjw

【摘要】

：

文本理解当前是自然语言处理领域极具挑战性的任务,其关键目标是使得机器具备类似于人的阅读能力,让机器算法模型在理解文本内容的基础上,正确给出与文本内容相关的问题的答

【作者】

：

刘亚秋

【出处】

：

北京邮电大学

【发表日期】

：

2019年01期

【关键词】

：

文本理解自然语言处理神经网络问答系统

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文本理解当前是自然语言处理领域极具挑战性的任务,其关键目标是使得机器具备类似于人的阅读能力,让机器算法模型在理解文本内容的基础上,正确给出与文本内容相关的问题的答案。对于文本内容的理解能力的提升,将会对于信息检索、对话系统、智能客服等应用领域有关键性意义。文本理解技术的发展成熟,将会彻底改变人机交互的体验,实现真正意义的智能化。相比于选择填空型文本理解任务,片段抽取型的文本理解任务更具有挑战性和代表性,目前正在受到越来越多的重视。本文契合当前的研究潮流,也以片段抽取型的文本理解任务作为研究重点,探索文本理解领域的新技术和新方法。当前的大规模文本理解任务数据集使得构建复杂的深层次的神经网络模型成为可能,本文将采用深度学习方法,构建文本理解任务模型对原文、问题进行抽象表示并预测对应的答案。当前的文本理解模型主要关注于词维度的语义匹配,返回原文中与提问内容语义相关性最大的部分作为答案。这种策略一般情况下能够正确回答提问,但是由于没有考虑提问句子的整体语义,可能导致模型不能理解真正的提问意图,最后返回错误的答案,即与提问句子中某部分内容相关性最大的原文片段并非是整个提问句子的答案。本文提出了提问语句语义总结机制和原文内容语义过滤机制,以使得模型能够更准确地理解提问意图。本文提出的模型在验证数据集上有明显的提升效果,答案的精确匹配率提升了 1.1%,答案的模糊匹配率提升了0.7%。另外在基于文本理解的自动问答算法的研究基础上,本文实现了一个自动问答算法原型系统以展示我们的研究成果。

其他文献

“菜篮子”里蕴含着无限商机——试论都市蔬菜配送

期刊

“菜篮子”农产品质量安全农业产业化经营毒大米深圳市生产者

巴斯加线性质的研究

论证了巴斯加（Ｐａｓｃａｌ）线的两条性质：在巴斯加定理中的６０条巴斯加线，每４条交于一点——对边交点；属于同一对边交点的４条巴斯加线，分属两个成射影对应关系的同底一维线束。布利安桑点也有类似

期刊

巴斯加线布利安桑点点列线束

爆破地震波作用下民房破坏分析和破坏特征

民房附近进行工程爆破时,爆破地震波对民房具有破坏作用。作用于房屋的爆破水平地震力易使砖砌房屋受剪力产生破坏。应用反应谱理论,得到了爆破水平地震力和房屋剪力的计算式

期刊

民房爆破震动破坏特征

人民币汇率对我国吸收外商直接投资(FDI)的影响——基于外商投资动机与市场区位选择的思考

依据外商投资动机把FDI划分为四个基本类型,借助净现值和资金循环原理将汇率水平和汇率预期对四类FDI的影响分别建模,利用2007—2012年的月度数据进行协整检验和格兰杰因果关

期刊

FDI即期汇率远期汇率市场导向成本导向运营成本货币转换货币升值预期

第三节螺旋溜槽

本文译自苏联列宁格勒矿井设计院所编“溜槽部件计算表”,全部共四节,这后面的二节是专家推荐译出的.

期刊

内螺旋

ML-kNN算法在大数据集上的高效应用

k近邻多标签算法(ML-k NN)是一种懒惰学习算法,并已经成功地应用到实际生活中。随着信息量的不断增大,将ML-k NN算法运用到大数据集上已是形势所需。利用聚类算法将数据集分

期刊

多标签分类ML-k NN聚类大数据集

基于环境绩效的科技进步评估

在经济快速增长与资源环境矛盾冲突日益加剧的情况下,政府在协调经济、社会、环境协调可持续发展方面承担着重要责任。环境与经济的协调可持续发展立足于科技进步,对地区科技

学位

环境绩效科技进步评估

农村小学德育工作存在的问题及对策

德育是学校教育的重要组成部分,是培养全面发展的社会主义建设者和接班人的重要途径,特别是《关于进一步加强和改进未成年人思想道德建设若干意见》的实施,切实加强了学校的

期刊

小学德育工作德育活动德育质量存在的问题及对策

儒家“天命观”对古代政权合法性的影响

两汉儒家形成的以天人感应、阴阳五行、灾异祥瑞等为主要内容的"天命观",对中国封建王朝的政权合法性具有深远的影响。它不仅为君权神授、君权至上和封建王朝大一统格局奠定

期刊

儒家“天命观”天人感应阴阳五行灾异祥瑞政权合法性

中国甘肃昌马断裂带及其现代活动

昌马断裂带是是青藏高原北部一条活动强烈的左旋走滑断裂带。它表现为重力、航磁、地壳厚度的综合异常梯度带，属于断面陡、切割深的超岩石圈断裂。昌马断裂带由１２条长４公里至１８公里

期刊

断裂带断层位移断层滑动大震应力场地震复发周期地震成因甘肃—青海地块昌马断裂带。

基于文本理解的自动问答算法的研究与实现

其他学术论文