基于CNKII的数字档案馆研究可视化分析

来源 :北京档案 | 被引量 : 0次 | 上传用户:yanxt99
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:为系统分析我国数字档案馆研究成果,促进数字档案馆的研究和建设,运用文献计量和可视化分析方法,对CNKI收录的1999~2014年数字档案馆研究的期刊文献,从数量、作者、机构、主题等方面进行统计,并结合知识图谱进行可视化分析,总结国内数字档案馆研究的文献分布、高产作者和机构,揭示数字档案馆研究的热点和发展趋势。
  关键词:数字档案馆知识图谱可视化分析统计分析CNKI CiteSpace
  Abstract:In order to analyse systematically the research findings of digital archives in our country,pro? mote the research and construction of digital ar? chives, this paper uses econometric analysis method and visualization analysis software to count the litera? ture quantity, authors, institutions, and themes of pe? riodical literatures on digital archives included in Chi? na National Knowledge Infrastructure(CNKI)pub? lished during 1999~2014, analyses the related knowl? edge maps drew by CiteSpace, summarizes the litera? ture distribution, high yield authors and institutions, reveals the hotspots and development trends of do? mestic studies on digital archives.
  Keywords:Digital archives;Mapping knowledge domain;Visual analysis;Statistical analysis;CNKI;CiteSpace
  一、引言
  数字档案馆(Digital Archives)是伴随着电子技术、计算机技术、网络技术、通讯技术、数据库技术、多媒体技术等的发展而产生的新型档案馆,也称作电子档案馆、虚拟档案馆、无墙档案馆等。[1]虽然,国内对数字档案馆的研究时间仅有十多年,但是近年来出现的富有行业特色的数字档案馆,如数字城建档案馆、企业数字档案馆等已经引起档案界的关注,并正在成为我国档案领域研究的重点和热点之一。具体而言,从国家宏观层面来看,相关政策和管理的稳步推进,促进和推动了我国数字档案馆的研究与实践。例如,自2002年以来,国家档案局陆续发布了《全国档案信息化建设实施纲要》《档案事业发展“十二五”规划》《数字档案馆建设指南》和《数字档案室建设指南》等标准规范。从微观层面来看,经过专家学者和档案工作者的不懈努力,也取得了丰硕的成果。在国内不断建成各类数字档案馆的基础上,促进我国数字档案馆建设的研究正在进一步深入。例如,2013年10月,时任国家档案局局长杨冬权在全国数字档案馆(室)建设推进会上发表了重要讲话,明确提出“用15年左右的时间,建成以数字资源为基础、安全管理为保障、远程利用为目标的数字档案馆(室)体系”[2]的我国数字档案馆(室)建设目标。2014年2月,国家档案局成立了数字档案馆(室)建设领导小组,杨冬权主持召开领导小组第一次会议,讨论通过了领导小组工作规则和《2014年数字档案馆(室)建设重点工作》。[3]
  为全面客观和系统地反映我国数字档案馆的研究历程,总结研究特点,分析研究热点,探寻研究趋势,为未来数字档案馆的研究、建设和实现我国数字档案馆建设的目标提供借鉴,笔者收集了中国知网(CNKI)收录的有关期刊文献并加以整理,借助相关软件对整理后的文献进行统计和可视化分析。可视化分析,作为一种新兴的信息处理分析方法,在档案类文献方面的研究仅有几年时间,对数字档案馆进行可视化分析的文献更少。例如,笔者在LISA数据库中未检索到相关文献,在CNKI中仅检索出相关文献2篇。
  二、样本文献来源、统计与分析工具
  (一)样本文献来源
  本文进行统计分析时抽取的样本主要为由CNKI检索而来的文献,选取时间为1999~2014年,检索日期为2015年1月26日,共得到检索结果1472篇。为确保检索结果的全面性,笔者对检索主题进行反复调试后,确定了以“篇名”为主题的检索入口,以“TI=‘虚拟/PREV 2档案馆’OR TI=‘虚拟/PREV 2档案室’OR TI=‘数字/PREV 2档案馆’OR TI=‘数字/PREV 2档案室’OR TI=‘数字化/PREV 2档案馆’OR TI=‘数字化/PREV 2档案室’OR TI=‘云档案馆’OR TI=‘电子/PREV 2档案馆’OR TI=‘电子/PREV 2档案室’OR TI=‘无墙/PREV 2档案馆’OR TI=‘无墙/PREV 2档案室’”为表达式的检索路径,对期刊、特色期刊、学术期刊三个数据库进行全面检索。同时,为确保样本的准确性,笔者逐一核对了题录与原文,剔除消息、广告、领导讲话、标准法规、文摘、书评等非学术研究类文献和一稿多投的重复文献,经整理,得到相关文献1339篇。
  (二)统计分析工具与数据处理
  进行统计分析时,主要借助两个软件工具,一是国内使用较广泛的CiteSpace(版本号3.7. R7),[4]该软件由美国学者陈超美开发,用于绘制知识图谱,计算节点的突变率、中心性等;二是作者自编的关系型数据库软件,用于机构、关键词等数据项的规范或补充,区分不同机构的同名作者,筛选分析样本,快速生成相关统计报表,并可生成用于CiteSpace处理的数据格式文件。[5]在进行数据处理时,利用自编软件完成。一是对简称、更名、合并及不同写法的机构名称进行统一;二是对部分关键词进行合并,删除CNKI自动标引的机标关键词;三是区分同名作者;四是剔除误检及不宜用作分析的非研究性文献,一稿多投文献仅保留1篇。经以上处理后,由自编软件生成可用于CiteSpace的WOS格式数据文件。   三、数字档案馆研究的可视化分析
  本文研究中相关数据由CiteSpace软件和自编软件统计得出,二者有关文献年代分布、作者与机构发文数量、关键词频次等重点方面的统计结果相同。另外,文中表格由工具软件分别生成或合并而成,作者合著网络图谱、机构合著网络图谱和研究主题与热点知识图谱由CiteSpace软件绘制并经调整生成。
  运用CiteSpace绘制图谱的时间范围为1999~2014年,以每2年为界进行时间分区,图谱上方由不同颜色色段连成的年度色带(自左至右由冷色至暖色),每种颜色分别代表2个年度,暖色对应的年份较近。时区阈值根据图谱效果调试设置;Pruning(剪切连线算法)选择Pathfinder(路径搜索算法)或Minimum Spanning Tree(最小生成树)及Pruning sliced networks(路径网络简化),这些设置及主要处理结果均在图谱的左上方呈现。图谱中的圆,分别代表作者、机构和关键词节点,节点内的色环及节点间的连线颜色代表的年度,与年度色带颜色表示的年度相对应。图谱中部分节点内还有红色色环,这些红色色环是突显率,反映较短时间内数量增长的快慢。
  (一)文献量和作者分析:2000年以来,数字档案馆在我国得到了较快发展,虽然部分年份上研究数量有所回落,但是基本呈稳中有升的趋势,如图1所示。同时,以潘连根、程妍妍、袁红军、唐艳芳、傅荣校等为代表的档案学者是数字档案馆研究的领军人物
  具体而言,独著论文占绝大多数,合著文献数量较少。经统计,1339篇文献中共包括1458个作者(含非第一作者)。其中,独著961篇,占比71.77%;两人合著287篇,占比21.43%。将数据导入CiteSpace,以节点类型选择作者(Author),运行调试后,得到文献作者的合著网络图谱,如图2所示。节点越大,表明作者的发文量越多,如潘连根、程妍妍、袁红军、唐艳芳等。同时,节点中有红色色环,表明他们在较短时间内发文较多。节点中的色环越厚,表明对应年份作者的发文越多,如潘连根、程妍妍、金更达等。节点间的连线,表明相连的作者间有合著。图中还有个别作者姓名后有大写字母,这是为了区分同名作者而添加的。值得注意的是,统计结果与图谱显示的发文数量较多的作者(按第一作者发文量排序,“ ”号的数字为第二作者发文数)大体相当。但图中个别较大的节点并未出现在表中(如谢海洋、金波、姚乐野等),这是由于CiteSpace生成的图谱节点仅依据总发文量生成,而没有区分作者排序,如表1所示。
  (二)发文机构分析:解放军南京政治学院上海校区、武汉大学、中国人民大学、绍兴文理学院等是数字档案馆研究的重要机构
  经统计,1339篇文献中共有机构724个(含不详和非第一作者机构)。其中,第一作者机构665个,且发文超过10篇的16个机构(发文量达322篇),仅1篇的482个。将数据导入CiteSpace,以节点类型选择机构(Institution),运行调试后,得到数字档案馆研究文献的机构合著网络图谱,如图3所示。节点越大,表明机构的发文量越多,如解放军南京政治学院上海校区、武汉大学、中国人民大学、绍兴文理学院等。此外,绍兴文理学院、上海大学、郑州师范学院等带有红色色环,表明这些机构在数字档案馆研究的某个阶段有较高的发文量。同时,笔者还对第一发文机构发文量的前十名进行了统计,依次为南京政治学院上海校区、武汉大学、中国人民大学、绍兴文理学院、浙江大学、上海大学、湘潭大学、郑州师范大学和南昌大学、苏州大学。
  (三)主题分析:数字化、信息化、知识管理是数字档案馆研究的热点主题;云计算、建设、档案馆、数字化和数字城建档案馆是数字档案馆研究的前沿方向
  关键词是从文献的标题、摘要和正文中选取的,能够反映文献的主题,[6]研究中往往用关键词进行主题分析,从中探究研究热点和趋势。经统计,1339篇文献中关键词2385个,其中不同关键词871个,有关键词的文献706篇。将数据导入CiteSpace,以节点类型选择关键词(Keyword),运行调试后,得到研究主题与热点知识图谱,如图3所示,为清晰显示节点及节点间的关系,图中隐藏了出现频次最高的关键词“数字档案馆”。节点越大,表明关键词出现的频次越高,节点间的连线及粗细体现出节点间共现关系的强弱。将自编软件统计的关键词频与CiteSpace导出的报表整合成表2。图中出现了数字化、信息化、知识管理等12个带有紫色外环的高中心性节点(中心性>0.1),表明这些节点在主题知识图谱中占据重要位置,是数字档案馆研究的热点主题。此外,图中的云计算、建设、档案馆、数字化和数字城建档案馆带有红色内环,代表了国内数字档案馆研究的前沿方向。
  运用可视化工具进行统计分析比传统的统计分析生动形象,但在同名作者及作者排序的区分、机构名称的一致、关键词的规范等方面仍存在问题,因而不能简单地以从相关数据库中获取的数据作为统计分析d依据,而要对此进行综合分析才能使结论更加客观真实。
  注释及参考文献:
  [1]潘连根.数字档案馆与相关概念的关系——数字档案馆研究之一[J].浙江档案,2004(3):18-20.
  [2]杨冬权.在全国数字档案馆室)建设推进会上的讲话[J].中国档案,2013(11):16-21.
  [3]韩冬.加强领导统筹规划狠抓落实——国家档案局数字档案馆室)建设领导小组近日成立[N].中国
  [4]Chen Chaomei. CiteSpace:Visualizing Patterns and Trends in Sci? entificLiterature[CP/OL].[2014-06-15].http://cluster.cis. drexel.edu/~cchen/citespace/download/.
  [5]李晓明. CAJD电子文件研究高被引文献的知识图谱分析[J].档案管理,2015(1):13-16.
  [6]倪丽娟,于淑丽.档案学研究热点分析——基于2004-2008年《档案学研究》、《档案学通讯》论文关键词的词频分析[J].档案学通讯,2010(1):19-22.
  作者单位:北京电子科技学院图书馆(档案馆)
其他文献
【摘要】高中文言文教学要想取得良好的效果,不仅要提高教师的教学水平,同时也要转变课堂教学的形式。营造诗意课堂不仅能够抓住学生的眼球,提高学生的学习兴趣,同时也能够激发学生参与学习的积极性,从而取得更好的教学效果。本文介绍了高中文言文教学的内容及任务,论述了高中文言文教学诗化课堂的营造方法,总结了未来文言文教学的多元化发展前景。  【关键词】文言文教学;诗化课堂;意境的营造  文言文诗化课堂的意义在
【摘要】文章以三年级上册的《卖火柴的小女孩》童话课为例,将“旁述默剧”“集体会议”“坐针毡”“开放式讨论”等戏剧范式与课堂教学结合起来有效应用,并采用教育戏剧对课文重构进行教学设计,使得小学低段的语文课堂更加活泼生动,培养学生独立思考的能力,激发学生学习语文的兴趣。  【关键词】教育戏剧;童话教学;戏剧范式  【基金项目】黄埔区教育科学“十三五”规划2019年面上一般课题,“基于课堂即兴微剧的活化
【摘要】文章对小学语文习作教学存在主要问题进行论述,并提出了具体解决对策:尊重学生主体地位,激发习作兴趣;运用多元教学方法,提升教学质量;引导学生积累素材,丰富学生认知;重视课外习作指导,做到长期践行;传授学生写作方法,提升习作技能。  【关键词】小学语文;习作教学;习作兴趣;习作素材  《义务教育语文课程标准(2011年版)》明确指出:“写作是运用语言文字进行表达和交流的重要方式,是认识世界、认
【摘要】从儿童立场出发,发现教材言语之妙;从年段教学目标和学生言语生长实情出发,研制教学重难点;从儿童心理、认知深度和认知落差出发,让教学设计落地。基于支持儿童言语学习的教学内容研制,让师生、教学彼此绽放。  【关键词】支持;儿童言语学习;教学内容研制  周庄的双桥因画家陈逸飞的油画《故乡的回忆》而闻名中外,陈逸飞也因双桥而被旅人惦念。游人因自然景观的衬托而显得更美,自然景观也因游人的到来而多了生
摘要:文章分析了数字校园环境下学籍信息电子化带来的凭证性风险与安全性挑战,从档案的原始凭证要求和电子文件的全程管理思想出发,提出一种基于关键业务过程控制与凭证性即时锁定的学籍电子信息可信管理的保障方法,并以高等学校电子成绩单档案管理为例探讨学籍电子档案的可信管理解决方案。  关键词:数字校园电子学籍档案可信管理凭证性保障  In this paper, the credential risk an
【摘要】數学课程标准特别强调要引导学生“做数学”。数学实验是“做数学”的有效形式之一。在小学数学教学中,基于学习主题设计实验方案,基于探究学习经历实验过程,基于激励评价保持实验热情,能够实现小学生数学实验的高效化。  【关键词】小学数学;实验教学;三部曲  数学实验,简单地说,就是一种针对数学知识的探究方式,也是提高学生数学学习参与度的有力举措,更是用于解决数学问题的重要方法。强化实验教学,一方面
【摘要】小学道德与法治是对学生进行品德教育的重要课程,是德育教育的重要载体。如何在道德与法治课堂教学中更好地落实德育教育,实现学科育德?本文将以小学道德与法治二年级下册“坚持才会有收获”一课的教学为例,浅析如何将本课的德育目标分解到教学的各个环节中。教师应摒弃说教的方式,运用回望生活、活动体验、批判反思、创设情境的方式,使德育教育达到入脑、入心的效果,在课堂教学中实现学科育德。  【关键词】品德与
【摘要】思维能力是学生学习数学知识的一项重要能力。学生只有具备较强的思维能力才能够真正掌握数学知识的内涵,从而更加熟练地运用到后期题目的解答中。文章主要对农村初中数学教学中优化学生思维能力的有效途径与策略进行了分析,能为教师提供帮助。  【关键词】农村学校;初中学生;优化;思维能力  一、引言  相对于城市初中数学教学来讲,农村中学由于教学资源与教学设备的局限,无法为学生学习提供充足的保障,所以只
【摘要】小学是教育发展的重要阶段,也是启蒙阶段,对于教育的发展有着重要的推动作用。在小学数学教学过程中,课堂提问一直是一种重要的教学手段,对于学生的学习有着重要的影响。教育不断发展,使得教师课堂提问的要求和方法也有了改变。为此,如何在多维角度下进行有效的提问,成为教师思考的重要方向。  【关键词】小学数学;多维提问;有效策略  在课堂教学过程中,提问是一种常见的教学模式,也是应用比较广泛的模式,不
近期,中共中央办公厅印发《关于在全体党员中开展“学党章党规、学系列讲话,做合格党员”学习教育方案》,决定在全体党员中开展“学党章党规、学习系列讲话,做合格党员”学习教育活动。开展“两学一做”学习教育,是继党的群众路线教育实践活动、“三严三实”专题教育之后,为深入贯彻全面从严治党的要求,加强思想政治建设,深化党内教育做出的又一重要部署。  本期“特别关注”栏目刊发《北京市档案局(馆)召开“两学一做”