论文部分内容阅读
关系推断是指利用知识图谱现有的实体间关系推断或推理实体间隐含的关系。尽管现有知识图谱存储着上百万关系类型、上千万实体,他们都存在关系缺失和覆盖率不全的问题。而由于数据的庞大和复杂的结构,依靠人力难以实现知识补全,关系推断是补全知识图谱关系的一个重要方法。 关系推断可以分成单网络的关系推断、跨网络的关系推断。单网络的关系推断即给定单个数据源,生成并补全该网络中隐含和潜在的关系。目前取得最优效果的是基于表示学习的关系推断方法,但该类算法主要应用了知识图谱的语义信息,很少应用知识图谱的结构信息,限制了关系推断的效果。跨网络的关系推断是给定多个数据源,对跨网络的关系进行补全,其中最典型的跨网络关系是实体间对齐关系。然而,传统的跨网络关系推断方法主要根据实体的周围节点的结构信息等,忽略了知识图谱的语义信息。为此,本文研究融合结构和语义信息的单网络和跨网络的关系推断方法,主要研究成果如下: (1)针对传统基于表示学习的单网络关系推断未充分利用网络结构信息的问题,本文从知识图谱中的典型结构层次结构入手,对单步层次结构数学建模,研究单步层次结构约束下的最优边距的几何意义,提出了单步层次结构约束的关系推断方法。实验结果表明,新方法在推断关系产生方面降低了错误率。 (2)针对单步层次结构只能刻画层间信息、无法刻画跨层信息的问题,本文通过多步关系路径生成,将单步层次结构扩展至多步层次结构,探索了多步层次结构约束的最优边距的计算方法,提出了多步层次结构约束下的关系推断方法。实验结果表明,新方法降低了单网络关系推断错误率。 (3)针对传统跨网络关系推断方法多从结构特征建模实体相似度、无法反映实体及属性的语义相似度的问题,提出了基于表示学习的跨网络关系推断方法,使用表示学习刻画语义相似度,并使用属性强约束的方法生成可信的跨网络实体对齐关系。实验结果表明,新方法提升了跨网络关系推断准确率。 (4)结合关键技术成果和实际用户需求,开发了面向视频领域知识图谱的关系推断系统,证明了方法的有效性。