【摘 要】
:
实体链接是将文本中的命名实体与已有知识库(如百度百科、维基百科等)中对应的实体记录相链接的过程。它能够对文本中的实体信息加以丰富,对于用户和计算机对文本的理解都具
论文部分内容阅读
实体链接是将文本中的命名实体与已有知识库(如百度百科、维基百科等)中对应的实体记录相链接的过程。它能够对文本中的实体信息加以丰富,对于用户和计算机对文本的理解都具有重要意义,在实体抽取、信息检索、机器学习等领域均得到广泛应用,目前已成为自然语言理解及语义计算相关任务的基础技术之一。在经典的实体链接任务中,所使用的知识库中的实体通常含有十分丰富的上下文信息,例如维基百科,其中的信息框、描述文本、锚点链接等,在链接的确定和消歧工作中都起到了重要作用。而本文所研究的一类实体链接问题——面向列表型知识库的组织机构实体链接,知识库是一个列表,列表中只含有组织机构名称的全称,而无其它上下文信息。组织机构名称在文本中广泛的以简称形式记录,然而对于这类问题,这些简称却无法与知识库中的全称直接链接,同时,这些简称也引起大量歧义。本文提出的面向列表型知识库的组织机构实体链接方法包含离线步骤和在线步骤。在离线步骤,通过对互动百科等资源的利用,我们设计组织机构名称的标注方法,并在此基础上生成其可能的简称,以此完成对知识库的扩充。在在线步骤,为解决歧义问题,本文提出了两阶段的实体链接方法,利用在同一篇文档或同一文档集中,同一个组织机构的全称与简称共现的规律,使用第一阶段对全称的实体链接结果,来约束在第二阶段中对简称的链接结果。本文使用由公安部提供的组织机构列表作为知识库,通过对公安询问笔录、新华网新闻的实体链接实验,验证了本文对组织机构名称标注方法和两阶段的实体链接方法的有效性。
其他文献
传统的激光引信设计和测试需要进行大量的实弹演练,为了克服由此造成的高耗费、低效率问题,本文设计并实现了一个基于虚拟现实技术的激光引信数字化仿真平台,用于辅助激光引信的
城市公交系统是与城市居民日常生活联系最为紧密的环节之一,甚至在一定程度上决定着城市居民的生活方式。城市公交查询能够帮助出行者快速地选择出行路径、换乘路线等,既提升了
查询优化是数据库管理系统设计和实现所采用的一项重要技术,也是直接影响数据库系统性能的一个重要因素,当前所有商用数据库都成功采用了这项技术。关系数据库系统和非过程化的
当今互联网信息纷繁复杂,搜索引擎为互联网用户提供了良好的信息搜索体验。而搜索引擎的查询词补全技术又进一步提高了搜索引擎质量,为用户提供了更优质的搜索服务。目前查询
中国民政部已于2003年成功实施了“省级行政区域界线信息管理系统”,并在湖北省、吉林省、山东省等省市自治区试点开展行政区域界线信息管理系统的建设,其中作为主要目标成果的
可视语音合成技术的研究大大拉近了人机交互的距离,它不仅能提高人机交互的和谐性,还能改进交互识别和表达的准确性,可广泛地用于虚拟现实、虚拟主持人、虚拟会议、电影制作、游
需求活动作为软件开发周期中的早期活动,是其后续活动的基础。需求是软件开发的依据、测试的准绳,需求与软件项目中各个角色(项目经理、设计人员、测试人员等)都密切相关。各个
高性能稳像平台技术在光电监视、跟踪、侦察等领域的应用日益增多,是当前控制领域的一个重要方向。稳像的实质是克服系统光轴相对惯性空间的运动,稳像系统的设计主要采用光学和
植物场景的实时并且高真实感绘制一直是计算机图形学的一个重要目标。鉴于植物在人们生产生活中的重要性,许多应用,如电脑游戏、城市规划、飞行模拟以及虚拟现实,都需要在已有场
地面自主车辆(简记为ALV)是指在各种复杂的陆地环境中,无须人工干预即可自主完成行驶任务的智能机器人系统,在军事领域和民用领域都有非常广泛的应用前景。ALV涉及结构学、控制论