基于主题模型的科技监测研究与实现:以科技报告为例

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:zlp0234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在知识经济、大数据时代,随着科学技术的蓬勃发展和科研成果的大量涌现,如何从海量的科技文献环境中提供有效的科技监测服务,从而为科研管理部门、学术科研人员提供有效的科技知识支持,已经受到了广大学者的高度关注与重视。一方面,科技文献“量”呈指数级增长,成为一座巨大的知识宝库;另一方面,面对海量、快速增长的科学文献数据,从文献数据库中快速有效地提取知识信息的需求变得非常迫切。如何在海量信息环境下进行有效抓住科技发展的脉络,并及时地把握研究热点是科技文献领域面向科技监测研究的核心和关键问题。  目前,在面向科技监测的研究中,采用的研究对象主要是科技期刊和专利文献,所应用的方法主要是文献计量和社会网络分析。为了使科技监测研究的数据来源更加多样化,研究方法更加完善、研究结论更有说服力,需要应用各种科技文献载体,并不断突破现有的研究方法。  因此,本文在对现有研究进行系统地调查与综合分析基础上,提出有效的、基于科技文献三大载体形态的基于LDA主题模型的科技监测方法。通过挖掘科技文献中蕴含的科技知识,以期实现揭示科学研究主题的演进过程与脉络目的,把握科技发展动态,提升其科技创新价值。  首先,本文以科技文献中“主题”的建模为切入点,以科技报告载体形态为例进行主题分析,构建“文档—特征词—主题”三层拓扑结构的内容主题模型;其次,重点研究如何实现对海量科技文献的动态“主题”自动发现及其在时间序列上的“演化”脉络的科技监测内容,具体包括主题挖掘、主题强度衡量、主题数量的确定和主题演化方式等四个问题;再次,设计并构建了基于开源平台JGibbLDA的科技监测原型系统。  最后在相关主题模型研究的基础上,将相似度运算作为面向科技监测的主题模型方法应用的突破口,提出了科技报告相似度计算模型和基于用户兴趣的推荐模型,完善了面向科技监测的衍生应用研究。
其他文献
晚期实体肿瘤侵犯骨髓并不少见,但以酷似急性白血病(AL)而原发肿瘤不明为首发临床表现的较为罕见,极易误诊;偶有明确诊断的,但因患者严重的血液和出血并发症无法耐受有效治疗
本文通过对荣华二采区10
期刊
信息时代的用户服务使图书馆面临着新的生存和发展危机,如何从传统的资源主导服务向以用户为中心的学科服务转变,成为众多图书馆领导者和图书馆组织无可回避的迫切课题,而学科化
2019年高考物理天津卷第12题以前沿科技成就——离子引擎飞机为背景信息,有效考查了学生运用所学物理知识建构物理模型,解决实际问题的能力.本文将对试题情境中涉及的离子推
本文站在高校图书馆的立场,围绕探索一种最大限度满足读者需求、合理使用购书经费、能够实现读者、图书馆和供应商多方共赢的高校图书馆PDA(读者决策采购)实施模式而展开,并最
档案在线服务,是档案服务社会化的发展趋势和重要方式,是档案网站和数字档案馆建设的主要目的,也是档案信息化建设的重要内容,必须引起各级档案部门和广大档案学者的高度重视
易地搬迁扶贫是通过对生存环境恶劣地区的农村贫困人口实施易地搬迁,根本改善其生存和发展环境的一项重要专项扶贫工程.当“一方水土养不起一方人”,易地扶贫搬迁帮助许多人
期刊
摘 要:本文在总结前人探究性学习成果的基础上,从其理论基础和概念入手,通过研究其分类、评价、误区,来提高探究性学习在地理教学中的可操作性。  关键词:探究性学习;地理教学;问题情景;探究模式  地理新课程标准提出:教育要立足于培养学生的地理核心素养,让学生拥有终身学习能力。基于建构主义学习理论的探究性学习,对于学生核心素养的培养、终身学习能力的形成,有积极的促进作用。  探究性学习自20世纪80年
基于教育部考试中心提出的“一体四层四翼”命题理念,针对当前“回顾+题型+训练”高三一轮常态教学模式,追问高考复习究竟应该怎样开展?知识点应该怎样复习?如何呈现典型例题等