论文部分内容阅读
对学科领域的主题分布和热点判别是学科领域分析的重要内容,对科研人员把握领域研究重点、管理决策者制定学科发展战略具有实际应用价值,科研资助基金作为促进科学发展、技术进步的有效手段,对其产出成果进行主题内容分析,有助于了解基金资助产出的主题分布和研究热点,有助于相关管理部门调整学科布局。本文在国内外相关研究调研的基础上,提出了系统分析基金资助项目产出的主题分布和热点主题识别的定量分析方法。首先对“热点”相关研究进行了广泛调研和分析,总结了目前热点识别的7类方法,即基于引用关系、基于词频、基于词间关系、基于突发词、基于主题模型、社会学领域的热点话题识别和其他方法等,指出对“热点”认识的不统一和“热点”识别方法存在的局限性,由此定义了本文“热点主题”的概念;并总结了目前对不同类型科研基金项目产出主题分析的不足,进而提出本文的研究问题,即基金资助项目产出的主题分布与热点判别方法研究。 本文的研究重点是主题分布与热点判别方法的设计,主题分布是热点主题判别的前提和基础,热点主题判别是主题分布的进一步深入研究。在主题分布分析中,提出将经典主题模型LDA(潜在狄利克雷分布,Latent Dirichlet Allocation)和项目数据结合的思路,定义了“领域—主题强度”和“项目产出—主题强度”用来定量表征研究主题的关注度,进行不同资助机构产出主题分布的定量比较,并用KL散度测度各资助机构论文产出与世界领域全集论文的主题分布的吻合度;在热点主题判别方法设计中,本文拓展了LDA模型单纯从时间的一维角度分析的思路,构建了基于“领域-主题强度”绝对值和“领域-主题强度”年均增长率的二维战略坐标----即热点主题判别模型,将主题划分热点主题、相对成熟主题、非热点主题和潜在热点主题,同时定义“热点主题相对强度”指标,反映基金资助论文相较于世界的平均水平。在方法设计中设置了多个对照组进行多层次的比较分析。以NSFC仿生材料领域资助项目的产出论文为实证研究对象,进行主题分布分析和热点判别,并与美国国家科学基金会(NSF)资助论文、德国科学基金会(DFG)资助论文、日本学术振兴会(JSPS)资助论文、我国其它资助机构资助论文、NSFC与我国其它机构共同资助论文、我国未受资助论文、整个领域未受资助论文7个对照组进行了比较分析,揭示了NSFC及各对照组论文内容的主题内容特征和规律,并与词频分析、共词网络的热点识别方法进行了对比,以及通过文献调研,从一定程度上验证了该方法的有效性。