【摘 要】
:
针对特定领域提出了一种结合词向量和图模型的方法来实现实体消歧。以旅游领域为例,首先选取维基百科离线数据库中的旅游分类下的页面内容构建领域知识库,然后用知识库中的文
【机 构】
:
昆明理工大学信息工程与自动化学院,昆明理工大学智能信息处理重点实验室
【基金项目】
:
国家自然科学基金项目(61262041,61472168,61462054,61562052), 云南省自然科学基金重点项目(2013FA030).
论文部分内容阅读
针对特定领域提出了一种结合词向量和图模型的方法来实现实体消歧。以旅游领域为例,首先选取维基百科离线数据库中的旅游分类下的页面内容构建领域知识库,然后用知识库中的文本和从各大旅游网站爬取到的旅游文本,通过词向量计算工具Word2Vec构建词向量模型,结合人工标注的实体关系图谱,采用一种基于图的随机游走算法辅助计算相似度,使其能够较准确地计算旅游领域词与词之间的相似度。最后,提取待消歧实体的背景文本的若干关键词和知识库中候选实体文本的若干关键词,利用训练好的词向量模型结合图模型分别进行交叉相似度计算,把相似度
其他文献
半正定矩阵与线性互补问题中的一些特殊矩阵有相似的性质,研究了特殊矩阵Cf0为半正定矩阵的充分条件,从而部分回答了 Murthy猜想。
通过计算系统的共生纠缠度和平均纠缠度,研究了二项式态与初始时刻处于 GHZ 类态的3个两能级原子相互作用系统的量子纠缠特性,讨论了二项式光场的最大光子数和系数参量对系统纠
以固体废物粉煤灰(fly ash,FA)为原料,通过负载壳聚糖和钙离子制得一种新型吸附剂(Ca/CTS/FA),将其用于模拟染料废水中直接桃红12B(direct pink 12B,DP 12B)和直接蓝2B(direct blue
建立了有常数输入且带隔离项的传染病模型,分析了模型的平衡点及稳定性,得到阈值R0的表达式.通过对阈值的分析,提出防治传染病的隔离措施,其中采取隔离措施的时间及强度是控