论文部分内容阅读
本文从知识图谱的相关理论和实践出发,利用科学计量学理论和可视化的相关技术,对信息检索领域发展进行研究。本文收录1954年至2011年11月SCI上的46,561条文献数据作为基础数据集,通过构建基于Prefuse的知识图谱系统框架,对信息检索领域学科发展进行分析和研究。 本文首先构建基于Prefuse的知识图谱系统框架,在此框架基础上进行信息检索领域知识图谱的构建和解读。通过对获得的数据集进行统计分析,对信息检索的学科结构进行研究,具体包括文献分析、学术会议和期刊分析、研究人员分析和相关学科分析;通过对数据集中关键词进行关键词的共词分析和系统聚类,构建信息检索的主题知识图谱,将信息检索的研究主题进行确定;最后,通过对数据集中的合著信息提取、构建合作网络、生成合作网络图谱,对信息检索的合著情况进行研究。 通过信息检索领域知识图谱的构建,验证了本文提出的基于Prefuse的知识图谱构建框架的可行性和实用性。然后,通过知识图谱的构建与解析,得出如下结论: 信息检索的文献从1954年出现后,到1990年逐年发文量相对稳定,而从1991年开始急剧增长,到2009年达到最高峰。信息检索研究的重要学术会议主要由IEEE和ACM举办,主要学术会议有IEEE组织的地球与遥感专题研讨会、IEEE图像处理国际会议、IEEE多媒体和世博国际会议、IEEE声学、语言和信息处理会议、IEEE模糊系统国际研讨会和ACM的SIGIR组织的信息检索发展研究国际年会;重要的核心期刊有美国信息科学与技术学会会刊、心理学评论、文献杂志、信息处理与管理和ACM通讯。 就研究者而言,高产作者以ChenHC和SpinkA为代表,高被引作者以SaltonG、TulvingE、BelkinNJ、SquireLR、VanrijsbergenCJ等为代表,高产作者和高被引作者存在不一致性。通过主题知识图谱构建,本文将信息检索研究主题分为智能化信息处理、搜索引擎相关、用户行为研究、信息系统研究和基于内容的信息检索研究五个研究主题。合著网络中以Zhang,L、Sprink,A和Schacter,DL为中心,组成了网络中规模较大的科研群体;以Tulving,E和Cabeza,R为代表,形成了信息检索领域凝聚力最强的合作群体。