大规模知识推理及其在深度问答中的应用研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:x1u2e3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,尤其是智能个人助理、智能客服、智能教育等应用的出现,人们已经不仅仅将互联网作为一个资料查询的工具,而且期望它能够智能地替人们完成信息筛选、归纳总结、模拟演绎等任务,甚至直接解决人们的问题。如何从大规模网络知识中总结出真实世界的规律和规则,以及如何运用这些规则得到目标问题的答案,已经成为亟待解决的问题,而对知识推理技术的研究正是为了促进这些问题的解决。但是将传统人工智能中的推理方法迁移并运用到基于大规模网络知识库的智能应用时,会遇到两方面的挑战:首先是大规模知识库对推理算法本身提出的新要求,包括需要高效的规则自动挖掘方法以克服专家规则集合不能有效区分噪声的问题,需要降低规则挖掘和推理算法的计算复杂度,需要更好地处理稀疏关系和稀疏规则;其次是自然语言表示的前端与知识推理所需要的假设形式之间存在沟壑,如何进行有效的转换也是一项重要的任务。  本文针对降低规则挖掘和推理算法计算复杂度以及克服自然语言前端向知识推理假设转化的问题展开研究,主要的研究成果包括:  1、针对逻辑规则挖掘依赖子图枚举或路径搜索等具有指数型计算复杂度操作的问题,提出基于实例化网络抽样的方法,并针对其中关键步骤——随机游走的效率问题,提出基于目标导向的随机游走算法。该方法通过随机游走在子图空间中进行均匀采样,等比例地缩小一条规则正负实例计数以及不同规则之间的实例计数,代替了具有NP难计算复杂度的子图枚举和路径搜索方法,并利用启发式方法设置状态转移概率,令实例化网络抽样方法的复杂度与知识库规模和逻辑规则长度无关。同时,该方法通过势函数捕捉目标与下一状态之间的联系,令随机游走在每一次跳转时都受到推理目标的指引,减小无效路径和噪声规则的召回,从而提高逻辑规则挖掘的效率和准确性。实验结果表明该方法可以在缩短规则挖掘时间的同时保证逻辑规则的质量。  2、针对推理过程中由于候选集过大而造成的推理时间长和存在无法区分噪声的问题,提出基于表示学习的候选预选择方法,并针对规则实例化计算复杂度高的问题,提出利用规则向量快速判断规则可用性的方法。该方法利用了表示学习模型计算速度快和前N准确率高的特点,快速地生成一个小规模高召回的候选子集,并将表示学习方法计算的候选得分作为先验指导后续推理过程中的随机游走以进一步过滤噪声。同时,该方法将逻辑规则表示为分布式语义空间中的向量计算符,去评估两个实体间出现规则实例的可能性,由此代替了复杂的图搜索或抽样的方式,提高了推理效率。实验结果表明,表示学习是一种高效且准确的候选预选择方法,而将候选得分作为逻辑推理方法的先验也提升了推理准确率,并且逻辑规则向量化的方式进一步地提升了推理的效率。  3、针对难以将具有复杂嵌套语义的自然语言表述向适宜的推理假设转化的问题,提出基于虚拟假设解耦的复杂问题推理方法。该方法首先将每一个问题和候选答案对表示成知识库中一个高层三元组,称为虚拟假设,然后在分布式语义空间中捕获虚拟假设与原问题之间,以及虚拟假设与逻辑规则之间的关联,并将这些关联作为证据加入到概率推理模型的目标函数中,从而实现了从自然语言问题向知识库上推理假设的转化。论文还提出了一个专门用于评估推理方法的问题数据集,涉及中英两种语言且包含七个自然与历史学科的真实考试题,实验结果表明基于虚拟假设解耦的推理方法解决了自然语言向推理假设转化的问题,将知识推理有效地应用于深度问答,提升了问答系统的性能。
其他文献
该文主要针对移动IPv6下的微移动进行研究,在对层次性移动IPv6协议进行分析的基础上,作者提出了多绑定层次性移动IPv6协议.这个协议是对移动IPv6的扩展,我们把全局移动和局部
Internet正改变着我们生活的方方面面,但任何领域都没有像商务运作那样经历着一场快速而巨大的变革,众多企事业单位纷纷转型到电子商务中来。在短短的几年中,电子商务彻底改变了
本文在数控系统平台模式开发的基础上,基于卷板机控制功能,开发设计了多种功能不同的控制模块,上位单片机控制模块、开关量控制模块、模拟量控制模块、显示模块等。根据卷板机的
随着计算机网络的广泛使用,网络之间信息的传输量不可避免的急剧增长,针对网络进行的入侵和攻击行为也层出不穷,提高网络的安全性和可靠性成为人们目前关心和研究的主要问题.
本文对光纤在线监测系统的国内外研究现状进行了调查研究,特别是对国内一些厂家的相关产品及市场占有情况作了比较深入的调研.通过对北京世纪瑞尔技术股份有限公司开发的Fibe
该文详尽分析了现有Web推荐系统使用的技术和存在的问题,在已有的Web数据模型基础上,结合Web挖掘技术对Web用户的访问模式发现、个性化推荐进行深入研究和探讨,提出了一个快
将实时网络与中间件技术相结合,针对实时分布系统对透明的实时数据传输、实时分布的任务调度和异构平台集成的需求,研究满足上述需求的实时网络技术。 使用实时网络来解决计
随着计算机信息技术和互联网技术的发展,社会各行各业的分工、业务流程、管理流程在发生着重大的改变。而如何运用先进的信息技术构建电子政府,实践电子政务,以电子化、信息化手
在数据库技术发展过程中,联机事务处理(OLTP,On-Line Transaction Processing)一度占据着数据库应用的主流.随着市场竞争的加剧,企业需要对自身业务的动作及市场相关行业的发
近年来,嵌入式系统以其可靠性强、体积小、专用性、成本低等特性得到日益广泛的应用。与此同时,一个独立的嵌入式系统的功能缺陷也逐渐暴露出来。新一代嵌入计算系统的功能集成