面向金融领域的知识图谱构建及补全研究

来源 :青岛大学 | 被引量 : 0次 | 上传用户:kc1223
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全球范围内伴随着云计算,大数据,人工智能等新兴技术的落地,互联网的数据量每两年翻一番,为了更好的分析及应用互联网数据,国内外学者及机构提出知识图谱概念。知识图谱将客观世界中概念,实体及其关系以结构化的形式呈现,以更直观让人类认识世界的形式将互联网的信息进行表达,在管理、组织及分析应用互联网信息上发挥出了巨大的作用。目前,知识图谱已经在医疗、商业及交通等行业领域得到了较好的应用且取得了良好的效果。但是目前针对金融行业的知识图谱相对较少,很多公司的金融图谱因信息的私密性不对外开放且应用时发现有隐含的关系尚未连接,因此在知识图谱构建完成后,后续的补全工作也变的尤为重要。经典的知识图谱补全模型往往只关注知识图谱中相邻的两个节点所组成的路径,忽略了节点与其它多个节点所组成的关系路径所带来的信息。本文针对金融图谱缺乏问题及知识图谱补全模型的缺陷,先利用金融股票及企业信息进行金融知识图谱构建,一方面以金融股票等信息为例描述金融知识图谱的构建方法,另一方面为后期知识补全任务提供基础数据集,然后提出基于组合关系路径的知识图谱补全方法对金融知识图谱进行补全任务验证。主要工作包括:1.基于金融知识图谱的缺乏及隐私问题,通过自底向上的知识图谱构建方法,爬取了股票网站—东方财富、百度股票,企业网站—企查查及相关金融论坛的金融股票,法人信息,通过自然语言处理算法进行企业实体、法人实体及实体间关系的抽取识别,最终清洗整理后导入neo4j图数据库,阐述了构建小型金融知识图谱的主要流程,完成金融知识图谱的构建,并为后期的知识补全工作提供基础数据集。2.对现阶段平移模型仅考虑两点之间相连的缺陷,基于节点之间连接的方向所代表的不同‘角色’,提出了基于组合关系路径的知识图谱补全模型,以节点之间的共现概率详细描述了在三节点结构下三种不同的关系路径连接模式,得到节点的向量表示,并通过负采样及随机梯度下降法进行模型优化。最终以本文中构建的金融知识图谱及Freebase数据集为数据来源验证了方法的有效性。
其他文献
<正>~~
会议
目的 探究胃炎片治疗胆汁反流性胃炎的临床效果。方法 选取我院收治的94例胆汁回流性胃炎患者作为研究对象,按照随机分组的方式将患者分为观察组(47例)和对照组(47例),对照组使用
水泥由于其原材料丰富,性能良好,被广泛应用在包括建筑工程和各类基建工程项目中,早已成为一种不可或缺的建筑原材料。球磨机是水泥粉磨环节中最为重要的设备,磨机内物料的总
个人信用历来是银行衡量个人履约风险最重要的因素。近些年,随着个人借贷需求与日俱增,违约风险也随之增多,这不仅是商业银行所面临的主要风险之一,也是导致整个金融体系不稳
土壤是陆地生物圈中最大的碳库,即使土壤有机碳的微小变化也可能对大气二氧化碳(CO_2)浓度产生深远的影响。作为SOC主要储集层的土壤团聚体,能为土壤有机碳(soil organic carbon,SOC)提供物理保护,这是碳固定的重要机制。而土壤团聚体中的有机碳受到很多因素的影响,本文主要研究东北农田黑土有机碳与气候因子之间的关系。本文选取东北典型黑土区不同水热条件,并具有相似农田管理措施的46个
<正>戚继光是中国历史上杰出的军事家、军事理论家、军械科学家、军旅诗人、明末著名的高级将领、伟大的民族英雄。历经嘉靖、隆庆、万历三朝。抗南倭,御北虏,集毕生之精力,
会议