【摘 要】
:
科技文献区别于其它同样以自然语言形式存在的文档的重要特征在于科技文献包含参考文献,引文符号前后一个较小区域内的文本段被称为引文上下文。在较长的一段时间里,引文上下文
论文部分内容阅读
科技文献区别于其它同样以自然语言形式存在的文档的重要特征在于科技文献包含参考文献,引文符号前后一个较小区域内的文本段被称为引文上下文。在较长的一段时间里,引文上下文的文本处理都没有得到足够的重视。然而,随着计算机技术的发展、科技文献可读文本化的实现以及科技文献开放获取运动的发展,对引文上下文的大规模计算机化处理已经成为了可能,引文上下文的研究工作也因此将迎来快速发展的阶段。
在对引文上下文的概念抽取的研究现状加以阐述的基础上,针对引文上下文的概念抽取难以实现自动化的问题,本文提出了引文上下文中概念抽取的方法,设计了引文上下文的概念抽取的系统,系统能够在限定条件下解决引文上下文中概念抽取自动化的问题,可以覆盖全部的参考文献和施引文献。而后,选取两年共计455篇某一期刊的文章作为实验数据,进行针对系统的实验,抽取了期刊文章对应参考文献的引文上下文当中以名词性短语形式存在的概念。结果表明,该系统能够达到接近自动化抽取概念的程度,并且可以覆盖研究范围内的全部参考文献和施引文献。
其他文献
产业竞争情报服务具体表现为一系列由政府部门、第三部门、营利性机构等多方主体开展的,服务于产业内群体企业,满足这些企业共性关键情报需求的各类产业竞争情报服务。由于在现
[目的/意义]以透镜理论为依据,从认知加工的角度出发,研究科学数据用户如何在数据共享平台中选取合适的数据.[方法/过程]研究分两个阶段进行,第一阶段选取14位被试通过半结构
档案信息资源的开发利用是档案部门的一项重要工作,满足大众的档案需求是档案开发工作的出发点。互联网时代背景下,大众习惯于在网上检索各类信息,建立档案全文数据库,实现档
[目的/意义]梳理国内外数字图书馆用户使用意愿影响因素的研究成果,为数字图书馆的建设实践和用户行为的理论研究提供参考.[方法/过程]通过调研数字图书馆用户接受、采纳和持
问题意识是人必须具备的一种素质.问题意识的培养也是摆在教师面前的一个重要课题.《语文课程标准(2011年版)》也明确指出:“充分激发他们的问题意识和进取精神……”但现在
本文从“网红”的传播方式、手段、技巧入手,以温州2000多名大学生参与“网红”传播体验为案例,通过理论和实践相结合的方法,探索“网红”传播方式在开展红色主题教育和在习
阅读是小学语文教学中最为重要的教学内容,可以说,教师大部分的教学时间和精力全都放在了阅读指导方面,但是从目前的教学情况来看,如何制定科学合理的阅读教学策略以培养小学
随着现代信息技术的发展,在小学数学教学中,逐渐广泛运用到互联网教学技术,因此使得微课教学在此背景下被教师们所巧妙地应用.除了对小学生数学学习兴趣的激发,还能充分营造
有效地采取数学教学实践活动可降低学生的学习难度,对于正在接受特殊教育的儿童尤其如此.在目前的教育情形下,特教小学数学教学实践实现需依据科学的教育理论,创新教育策略,