论文部分内容阅读
近年来,随着科学技术的飞速发展,互联网已经潜移默化地影响人们生活的各个方面,其可访问性也逐渐增加了获取信息的灵活。比如通过搜索引擎获取信息,用户通过浏览搜索引擎返回的相关页面寻找答案。但针对特定领域,例如金融领域,金融理财产品和领域信息复杂多样,搜索返回答案的方式不够高效,用户仍需根据领域专业知识排除冗余信息,所以问答系统应运而生。现如今我国金融服务的覆盖率已达99%,越来越多的人想迈入“金融圈”,传统的咨询方法受地域和时间限制,所以开发一款金融领域的智能问答系统是必要的。针对智能问答问题,本文在用户意图识别方面采取了两个子任务:实体识别和实体链接。在实体识别任务中采用BERT-Bi LSTM-CRF模型识别金融实体以及相关提及;在实体链接任务中提出BERT-CNN-DSSM模型完成冗余信息的去除。该模型使用BERT进行文本预处理,将实体识别任务中得到的实体和提及进行低维向量化表示,输入CNN层中,通过对CNN中卷积核宽度的设置来提取多个连续词之间的深度语义信息,最后将结果输入DSSM中进行语义相似度计算,完成实体消歧工作,通过与其他模型进行对比实验,验证了该模型的优越性。针对领域知识图谱缺乏问题,本文构建了一张金融领域的知识图谱并阐明了构建过程:首先对采集到的金融数据进行分析,设计实体,关系和属性表,进而进行信息抽取和知识融合得到金融领域的知识图谱,然后将知识图谱存储进Neo4j图数据库中,作为本文系统的知识数据库。基于上述主要工作,本文研发了一款基于金融领域知识图谱的智能问答系统。该系统根据需求分析,面向金融从业人员和普通用户。提供系统管理、数据管理和问答等功能。在用户键入问题后,进行语义分析,得到关键实体,进而检索知识数据库。根据用户指令返回文字解释或相关知识图谱。同时支持金融从业人员对知识图谱中的实体进行操作来更新知识图谱。系统采用B/S架构,使用Python语言进行开发,VUE.js完成前端页面功能,CSS进行简单美化,数据库包括Mongo DB、Neo4j和My SQL。通过功能测试和性能测试,本文的系统可以实现金融领域方面的智能问答,系统在功能和性能上均达到预期标准。