构建金融知识图谱以及投资关系分析

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:cuisong521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科技是逐利的,人工智能作为当前最先进的科技之一,首当其冲的领域就是金融行业。在金融领域中,传统的行业研究员在做行业分析时,根据自身积累的行业知识,来判断新的数据对旧的状态的影响,但现在数据处于爆炸式的增长,传统的行业研究员几乎难以满足客户日益丰富的需求。在此背景下,本文提出了构建证券行业的金融知识图谱。知识图谱由Google于2012年提出,用来描述真实事件中存在的各种实体和概念及其相互关系,顾名思义,证券金融知识图谱描述的是证券金融行业的实体、概念和关系,它就像一个超级大脑,集众人之智慧,装下了证券金融行业的基本常识,释放研究人员简单重复的劳动,把更多精力放在研究更难的问题上。本文的主要贡献如下:  (a)针对不同网站资源,提出了一种基于启发式规则的网页正文内容抽取算法,免去了传统的不同网站不同爬虫规则的繁琐,同时实际测试效果很好;  (b)研究使用Deepdive从非结构化文本数据中提取股权投资关系;  (c)创新性的提出基于图论算法分析证券金融市场中各实体之间的关系,包括基于最短路径算法分析两家公司最短投资关系以及最主要投资联系;其次使用深度优先搜索算法来检查两个实体之间是否存在共同投资者;由于图中包含大量的实体节点和边,对计算效率影响很大,采用图形压缩来减少计算的节点数量,提高效率。  本文构建的金融知识图谱以及基于金融知识图谱的投资关系分析已被实际应用于长江证券的新三板业务分析。
其他文献
随着经济的发展,各企业越来越重视库存的管理与控制,库存管理和控制的好坏被看作是企业降低成本,提升第三方利润的源泉。但传统的库存管理与控制方式已经不适合现代企业的发展了
工业化是人类社会所经历的一场伟大的社会经济变革,它是现代化的前提和基础,高度发达的工业社会是现代化的重要标志。工业化成为各国追求的目标。我国作为一个发展中国家,在经济
吴婶遇不得事,遇到事就想老伴,就站在院子里,痴痴地望着东坡那片青冈林。老伴在青冈林里躺了五十多年。平时,吴婶有事没事,总爱背个差不多与她身子一般高的背篼去那里捡柴。落在地上的青冈叶厚实,火旺,经烧,做毛毛柴的引火柴蛮好。背篼满了,她就坐在老伴的坟头歇气。她先是伸手拢拢头上的白发,把粘在发梢上的枯草碎叶一点点拈掉,然后就念,死鬼,儿子才六岁,你一蹬脚就走了;孙子才六岁,儿子和儿媳妇一蹬脚就走了。我这