论文部分内容阅读
创新是一个国家兴旺发达的不竭动力,科技研究和发明创新对一个国家科技事业的发展意义重大。在大数据的时代下,研究者需要从海量的文献信息中找到需要的知识进行研究创新,这必然会带来繁重甚至重复的工作量,如何从中高效地产生新颖而有价值的研究思路已成为研发过程中的一个瓶颈。因此,本文的研究意义在于提出了一种从单篇科技论文中抽取概念地图的方法,通过构建出科技论文的微观概念地图形象地描述作者在研究中重视并运用的知识结构,并通过对概念及其关系的定量分析推测作者的创新思路,帮助研究者进行研究创新。本文通过从概念地图的起源与发展、概念地图的构建和应用以及研究思路挖掘的现状进行研究,并深入研究概念地图中概念和关系的结构和语义关系,提出动态构建科技论文微观概念地图(microscopic concept map,MCM)的方法,定量的描述论文作者的文献研究网络,为研究者的科技研究提供帮助。论文的主要内容包括:微观概念地图的定义和描述。该部分对微观概念地图的构成和特点进行介绍,并且提出了两个假定。微观概念地图的构建。该部分中微观概念地图构建的过程主要分为两个阶段,一个是MCM抽取规则的设定,第二个是根据设定出的规则构建目标科技论文的MCM。这个阶段主要包括目标数据源的确定和预处理、单句依赖树的生成、单句MCM片段的生成以及目标数据源MCM的生成。基于微观概念地图的研究思路的挖掘。通过对构建出的MCM进行精炼,定量描述并且可视化的展现出MCM中的主要概念权重及其之间距离,利用思路可能性指标和链路预测方法进行研究思路的挖掘。实证分析。为了验证论文方法的有效性,选取了代表研究者两种不同的表达方式的发表在Science期刊上的关于聚类方法的论文,通过展示其MCM的抽取及论文研究思路的挖掘过程,验证了本文方法的有效性。