【摘 要】
:
术语抽取是学术文献知识挖掘的关键技术,其研究目标是提升学术文献领域术语抽取的效率。目前术语抽取主要分为三类方法,即基于规则的方法、基于统计学的方法、基于监督学习的
【基金项目】
:
国家自然科学基金青年项目(71904078),江苏省自然科学基金(BK20190793),江苏高校哲学社会科学研究基金(2018SJA0263)的研究成果之一
论文部分内容阅读
术语抽取是学术文献知识挖掘的关键技术,其研究目标是提升学术文献领域术语抽取的效率。目前术语抽取主要分为三类方法,即基于规则的方法、基于统计学的方法、基于监督学习的方法。首先,本文对术语抽取中的代表方法进行了实验对比研究,包括语言学、统计学(TF-IDF、C-value、基于KL散度的方法等)、CRF及Bi-LSTM方法;其次,针对目前学术文献中术语抽取缺乏大量的手工标注语料的问题,提出了应用于当前学术文献术语抽取的改进模型;最后,总结了实验发现并提出了现阶段学术文献术语抽取及语料标注的方案。
其他文献
目的探究SALL4基因与KLF基因在肝内胆管癌中的相互作用与影响。方法采用生物信息学方法预测SALL4与KLF4基因启动子之间的作用位点,并通过荧光素酶报告系统进行验证;RNA干扰技
重大突发事件频发促使学术界更加重视应急管理的创新研究。将知识管理引入应急管理中产生了应急知识管理新领域。文章阐明了应急知识管理与应急管理、应急信息管理的关系,认
为避免新型冠状病毒肺炎(NCP)蔓延,在“停课不停学”思想指导下,全国开展了广泛的在线教育。SPOC作为一种面向小规模群体具有限制性约束的在线教育模式,能有效提升学生的学习
目的观察混合核苷片辅助治疗脑胶质瘤放化疗后骨髓抑制的疗效。方法选择2016年5月—2018年12月我院收治的脑胶质瘤放化疗后骨髓抑制患者60例为研究对象,根据治疗方案的不同分
目前客车轴温报警器误报警、开路、通信率低、死机故障的情况特别多,给轴温报警器的检修带来极大困扰,不仅严重干扰了车辆乘务员的乘务工作,也给列车的运行带来安全隐患。轴
文章深入阐述新时代新旧动能转换的内涵实质和协同发展产业体系的内涵及其建设重点,从实体经济结构性失衡、科技创新的主体培育与应用衔接缺位、现代金融与实体经济错配和产
介绍了一座全长110米的钢筋混凝土连续箱梁桥的抗震设计,该桥位于地震烈度为8度的地震区。通过E1弹性工作状态、E2弹塑性状态两阶段地震设计分析桥梁基础的最不利受力情况,分
目的采用生物可降解材料乳酸-羟基乙酸共聚物(PLGA)为载体,比较不同的制备方法和工艺对紫杉醇(PTX)PLGA纳米粒(PTX-PLGA NPs)粒径的影响,筛选出最优制备工艺,并考察所制备纳