大规模结构化知识的表示学习、自动获取与计算应用

来源 :清华大学 | 被引量 : 1次 | 上传用户:zhengi520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱是人工智能研究和智能信息服务基础核心技术,能够赋予智能体精准查询、深度理解与逻辑推理等能力。目前,基于深度学习的自然语言处理技术只能从数据中机械地学习完成特定任务的语义模式,不具备鲁棒性和可解释性,做不到对语言的深层理解与推理。我们认为要想实现真正的自然语言理解,需要在现有深度学习技术的基础上融合知识图谱信息。实现自然语言处理与知识图谱的融合并非轻而易举,需要解决几个关键问题:(1)知识表示。在深度学习模型中充分利用大规模知识图谱,需要首先解决知识图谱表示的问题。在这方面,我的工作包括:a.考虑知识图谱复杂关系的知识表示:我们提出了基于映射矩阵进行空间投影的知识图谱表示模型,用于处理知识图谱中的复杂关系。b.考虑知识图谱复杂路径的知识表示:我们认为实体之间多步的关系路径同样包含着丰富的关系推理信息,并提出了一种基于路径表示的知识图谱表示模型。c.考虑知识图谱复杂属性的知识表示:我们提出了一种同时学习知识图谱中实体、关系和特性表示的知识图谱表示模型,以提高知识图谱表示的质量。(2)知识获取。如何从互联网大规模的结构化、半结构和无结构数据中自动获取知识,辅以少量人工校验,是大规模知识图谱构建的必由之路。在这方面,我的工作包括:a.基于选择注意力机制的关系抽取:针对远程监督数据中存在大量的噪音的问题,我们提出了一个基于句子级别选择注意力机制的神经网络关系抽取模型,用于过滤错误标注的句子。b.基于多语言注意力机制的关系抽取:现有的关系抽取系统通常专注于如何更好地利用单语言数据,忽略了多语言数据对于关系抽取任务的帮助。针对这个问题,我们提出了一个基于多语言选择注意力机制的关系抽取模型。(3)知识应用。面向不同自然语言处理任务,我们需要探索将知识合理地融合到该任务下的深度学习模型中,实现知识指导的自然语言理解。在这方面,我的工作包括:a.基于知识的实体分类:我们提出了基于知识注意力机制的实体分类模型,用于考虑命名实体和上下文之间的联系以及知识图谱中丰富的有关信息。b.基于知识的开放域问答:我们借鉴人类回答问题的模式提出了一个基于‘‘粗读-精读-总结’’模式的开放域问答系统。我们的工作有效地解决了面向知识图谱的知识表示、知识获取、知识应用中的关键问题,为迈向真正的自然语言理解打下了坚实的基础。
其他文献
化疗是最经典的晚期癌症治疗方法之一,化疗药通过消除免疫抑制细胞或引发肿瘤细胞的“免疫原性细胞死亡”来增强抗肿瘤免疫效应,而系统性免疫抑制极大地影响了化疗的抗肿瘤效
学前师资"产教融合"人才培养模式的研究对于推动学前教育的发展有很大意义。就目前的文献来看,关于学前师资的"产教融合"模式的研究少之又少。本课题正是基于师范类专业认证
<正>结题报告编号:JKY10078时间:2019年4月——2020年5月1.选题的意义、价值和理论支持1.1选题的理论意义百年大计,教育为本。当今世界呈现多极化发展,国际交流复杂多变,大学
会议
"捺·立·平"训练法,是指在训练足迹识别技能时,以在平面穿鞋足迹中识别出赤足的足型结构特征为目标,按照先训练捺印足迹识别、再训练立体足迹识别、最后训练平面足迹识别的
<正>一、案例展示在教授人教版初中历史七年级下册第20课《清朝君主专制的强化》的第一子目《军机处的设立》时,我设计了历史情景剧。学生在课前进行排练,上课时表演给其他同
<正>~~
会议
甘氨酸可以合成多种药物,如治疗高血压药物盐酸地拉普利、抑制胃溃疡用碳酸钙制剂、扑热息通甘氨酸盐、单甘氨酸乙酰水杨酸钙、利血胺注射液、抗巴帕金森氏病药物L-多巴、甲
介绍谢晶日教授治疗慢性萎缩性胃炎经验。谢教授认为本病与虚、滞、瘀、毒关系密切,脾胃虚弱、气机失调、瘀毒互结为基本病机,属本虚标实。治疗上以健脾和胃、益气养阴为主,疏肝
随着移动互联网、云计算、大数据等互联网新技术、新业务的快速发展,内容分发网络(CDN)作为缓解互联网网络拥塞、提高互联网业务响应速度、改善用户业务体验的重要手段,已经
在传统的噪声控制研究中,大多以声压级作为评价控制噪声的指标,由于声压级并不能全面地反映人对于声音的客观听觉感受,所以对于如飞机、汽车、高铁和潜艇等载人装备的内部空