论文部分内容阅读
为了适应日益增长的网络信息检索的工程应用,用于分析基于知识图谱的智能问答算法研究日趋活跃。知识图谱在智能化服务中发挥着重要作用,但是,复杂的语义关系给知识抽取带来了巨大的挑战,问答研究的准确性也还有待提高。为此,本文以知识图谱中的知识抽取作为研究课题,重点研究了不同场景下的关系抽取模型的实现技术和关系抽取对问答准确性的影响。本文主要工作和贡献如下:1.提出了基于Bi-LSTM的层次关系抽取模型。传统模型通常解决一般性分类问题,导致抽取结果的精度较低。本文利用关系标签之间的层次化语义信息进行建模,提出了使用层次化损失函数的抽取模型,弥补了模型在反向传播中语义特征不足的缺点。实验表明本文方法相比CNN、RNN等传统抽取模型能有效提升知识抽取的性能。2.提出了基于上下文注意力机制的少样本关系抽取模型。当前模型多是基于有监督的学习方法和远程监督,无法应用于数据不足时的使用场景。本文利用少样本学习方法,使用上下文注意力机制构建模型。实验结果表明本文方法在数据稀疏时仍然可以进行关系抽取。3.提出了基于知识嵌入注意力的问答模型。在使用知识图谱来完成问答任务时,关系预测是其中一项子任务。现有模型没有有效利用候选实体和关系,使得问答准确性不高。本文提出使用知识嵌入注意力来融合候选实体、候选关系和问句文本来提升关系预测的准确率。实验结果表明本文方法比现有的问答模型性能更加优越。4.设计并构建了基于医疗领域知识图谱的智能问答系统。通过自定义的医疗实体和关系类型,搭建系统各个模块,形成了一个初具规模的医疗领域知识图谱和智能问答系统。