基于期刊的作者共现在学科用户研究中的应用

来源 :图书与情报 | 被引量 : 0次 | 上传用户:yangyng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:准确判断学科用户特征是学科情报服务的基础。文章首先从学科用户发表文献、引用文献和被引文献三个维度研究其在期刊层面上的共现现象,探索了基于期刊的作者共现在学科用户分类中的应用;依据学科用户分类结果,构建了用户组——期刊二模网络,揭示了不同学科用户和不同期刊在机构科研网络中的表现;基于对学科用户分类和用户组-期刊二模网络的分析,对学科用户服务提出建议。
  关键词:期刊级 作者共现 学科服务 用户研究
  中图分类号: G254.97 文献标识码: A 文章编号: 1003-6938(2013)05-0067-05
  1 引言
  学科情报服务是图书馆深化情报咨询服务和学科化服务的重要举措,它是以用户学科情报需求为中心,收集相关学科信息,利用情报研究方法,结合学科专业知识及其专有方法,从研究的角度进行情报分析,为用户提供科技决策、科技管理的信息保证和科技决策的依据、建议和方案等的一种具有高附加价值的深层次专业知识服务。加强学科用户的研究, 是保障学科情报服务高效运行的措施之一,其具体研究内容主要包括用户数量规模、用户研究方向、信息需求类型、需求量、获取信息的能力与方式等, 并据此对学科情报服务人员、技术与设备等相关资源加以合理配置。
  目前,大部分学科情报服务实践中,用户的学科属性是基于其所属机构的。以国内高校图书馆的学科情报服务——学科馆员服务为例,所有用户的学科划分均依据其所属院系,学科馆员的配置及其学科定位均以此为基础展开。然而当今科技发展一方面呈现精深细化的特点,另一方面又表现出高度的交叉性。由此直接导致同一机构内科研人员研究领域之间的差异越来越显著,而不同机构间科研人员研究领域间的关联却越来越强。以中国农业大学为例,很多传统农学相关专业当前的关注点与生物学院下设专业有着很强的交叉性,其研究内容相关性非常大;而生物学院内设专业由于研究的切入点不同,其关注点又各不相同,研究内容也大相径庭。
  对科学共同体的研究有基于论文合著关系的,也有基于论文引用关系的。通过论文合著途径,可以揭示科学家之间较为明显的联系[1],而引文途径则可以揭示科学家之间隐藏的或未知的联系。20 世纪80年代White和Griffith 提出的作者同被引分析方法主要是以两两作者被同一文献引用为出发点,有将其用于科学共同体结构特征比较[2]和科学家学科地位评价[3]等方面的研究;作者引文耦合分析方法是以两两作者对同一文献的引用为出发点,其结果可以与作者同被引分析相互印证和补充[4];尚无将作者同被引分析与作者引文耦合分析结合用于学术共同体识别的相关研究。本文试图从学科用户间的同被引和引文耦合现象入手,结合其论文发表情况,在期刊层面上考察其共现现象,探索基于期刊的作者共现在学科用户分类中的应用。除此之外,还通过分析作者组-期刊二模网络的属性,揭示不同学科作者组和不同期刊在机构科研网络中的表现,以期为推出效率更高、针对性更强、重点更突出的学科用户服务提供依据。
  2 数据来源和构建
  本文数据来源于ISI-Web of Science(SCIE & SSCI)数据库。分析数据集构建过程如下:
  1)利用检索式“AD = china agr univ”,限定文献类型为“Article”、“Proceedings Paper”、“Review”,检索中国农业大学发表的论文,共计6125篇(检索日期:2012年7月2日),导入EXCEL,构建初始论文集Article_1;
  2)利用Web of Science的“引文报告”功能,获得Article_1的引文15662条,导入EXCEL,构建引文集Citation_1;
  3)从原始论文集Article_1中筛选通讯作者地址(RP字段)为中国农业大学的论文,获得分析论文集Article_2;
  4)清洗通讯作者,合并同名作者,获得作者908位,构建作者集Author_1,;
  5)提取分析论文集Article_2的参考文献信息,构建参考文献集Reference_1;
  6)利用EXCEL VBA统计各通讯作者文献发表、文献引用和被其他文献引用的情况,生成作者基本信息表(见表1)、作者-论文表、作者-参考文献表和作者-引文表。
  3 研究方法
  3.1 “作者-作者”共现矩阵的构建方法
  由于各作者研究方向和主题上存在的差异,以及单个作者、单篇文献涉及范围的局限性,各作者在单篇文献层次上的共现概率很低,以致出现较多孤立作者,不利于进一步聚类分析,所以本文扩展了作者共现的范围,确定以期刊层面的作者共现作为统计对象。
  本文关于期刊层面的作者共现统计,从以下三个角度进行:一是论文发表期刊,二是论文引用期刊,三是论文被引期刊。利用表2所列方法,统计生成基于论文发表期刊的作者共现矩阵Ma、基于论文引用期刊的作者共现矩阵Mr和基于论文被引期刊的作者共现矩阵Mc。
  由于Ma、Mr和Mc分別受作者发文量、作者引用文献量和作者被引频次的影响,因此整合三个矩阵时先利用表3所列公式将其分别转化为等价矩阵,然后对Ea、Er、Ec求和,构建基于期刊的作者等价矩阵[5]。
  3.2 “作者组-期刊”二模网络分析
  采用离差平方和方法,以绝对值差为度量标准对基于期刊的作者等价矩阵进行聚类[6]。将聚类结果代入作者-论文发表期刊矩阵、作者-论文引用期刊和作者-论文被引期刊矩阵,利用公式(1)分别计算各作者组在发表期刊、引用期刊和被引期刊上的分布情况,
  Ck,m=∑Ck,m,i (1)
  其中,Ck,m表示聚类簇k在期刊m上的出现频次,Ck,m,i表示聚类簇k包含的作者i在期刊m上的出现频次。   考虑到各作者组发文量、引用文献量和被引频次的不同必然导致其发表期刊、引用期刊和被引期刊分布频次的不可比性,本文利用各作者组发文量、引用文献量和被引频次分别对其发表期刊、引用期刊和被引期刊的频次进行了修正。对修正后的作者-论文发表期刊矩阵、作者-论文引用期刊和作者-论文被引期刊矩阵求和,生成作者组-期刊二模网络。
  二模网络描述的是两类群体(模态)在网络中的关系,通过中心度的测度可以揭示不同群体成员在网络中的重要性,本文采用点度中心度和中介中心度来测度作者组节点和期刊节点在二模网络中的表现。其中,“点度中心度”是基于“在一个社会网络中,如果一个节点与其他节点之间存在的联系越多,那么该节点的中心地位越突出,其在该网络中拥有的权利越大”的思想,通过计算与某节点间有联系的节点数量来表征该节点的重要程度;“中介中心度”表征的是节点在网络中处于其他两个节点之间路径上,对其他节点的中介作用,即其控制其他两个节点之间交往的能力。在本文构建的作者组-期刊二模网络中,作者组节点的点度中心度表示的是与该作者组相关联的期刊的数量,而期刊节点的点度中心度则表示与该期刊相关联的作者组的数量;作者组节点的中介中心度是指该作者组在网络中作为两种期刊连接桥梁的重要程度,而期刊节点的中介中心度则是指该期刊对连接两个作者组的重要性[7]。
  4 结果分析
  利用本文提出的“作者-作者”共现矩阵的构建方法,构建基于期刊的作者等价矩阵,如表4所示。
  基于作者等价矩阵,采用离差平方和方法,以绝对值差为度量标准进行聚类。由于聚类过程中存在部分聚类簇规模过小的情况,本文预设将规模小于全体作者数2%的聚类簇剔除,在保证保留聚类簇与学科馆员人数(中国农业大学学科馆员共有15名)相等的前提下,经多次试验,最终确定聚类数为24,结果见表5。
  使用本文3.2部分给出的方法构建“作者组-期刊”二模网络。由于该二模网络涉及期刊过多,结构过于复杂,因此本文对其进行了修剪:首先对作者组-期刊间的关联强度求平均值,保留大于等于平均值的、忽略小于平均值的,保留关联强度值5625个;继续对余下作者组-期刊间的关联强度求平均值,保留大于等于平均值的、忽略低于平均值的,保留关联强度值1267个;继续求平均值,保留大于等于平均值的、忽略低于平均值的,保留关联强度值833个;继续求平均值,保留大于等于平均值的、忽略低于平均值的,保留关联强度值172个。以这172个关联强度值所涉及的作者组和期刊为基础生成作者组-期刊相关矩阵,对其求平均值,将大于等于平均值的赋值为1,小于平均值的赋值为0,生成作者组-期刊二值矩阵[8];将该二值矩阵导入社会网络分析软件Ucinet,生成作者组-期刊二模网络图(见图1)。
  进一步分析各作者组及期刊在网络中的表现情况,结果如表7、表8所示。从表7可以看出,期刊Journal of Agricultural and Food Chemistry(农业与食品化学)点度中心度和中介中心度均为最高,表明其在网络中与其他节点关联度最高,且在网络中对其他节点的沟通作用最强,因此该期刊对整个中国农业大学科研网络而言最为重要,对该刊应重点保障,开展学科情报服务时应针对该刊进行动态监测。
  从表8可以看出,作者组4和作者组7的点度中心度最高,表明这两组在网络中与其他节点关联度最高,对整个中国农业大学科研网络最为重要;作者组4和作者组18的中介中心度最高,表明这两组作者在网络中对其他节点沟通作用越强,节点的中介作用越强。在人员有限的情况下开展学科情报服务时,应重点针对作者组4、7、18,尤其是作者组4做需求分析,进行重点保障。
  4 结语
  本文基于期刊层面的作者共现聚类分析方法对揭示同一机构作者间研究的相似性和差异性具有十分重要的意义,以聚类结果为基础进行的二模网络分析进一步识别出机构科研网络中应予重点关注的研究团体和学科资源,从而为学科情报服务资源的优化配置提供了决策依据。
  中国农业大学的学科情报服务可依据作者聚类分组情况,为每个作者组配置相应的学科馆员,根据各组与其相关期刊相关性的强弱,决定重点保障與推送的资源和内容;依据作者组在网络中的表现,进一步深入分析其学科优势与劣势,为学科发展献言献策;根据期刊在网络中的表现,进一步深入分析期刊的内容,挖掘期刊对学科的意义,进而实现更深层次的学科情报服务。
  参考文献:
  [1]刘璇,郦芳.图书情报学学术团体现象实证研究[J].情报杂志, 2010, (3): 20-25.
  [2]雷银枝,宋歌.科学共同体测度方法的改进与实证研究[J].科学学与科学技术管理, 2011, (4): 13-19,97.
  [3]Ding Y. Topic-Based PageRank on Author Cocitation Networks[J].Journal of the American Society for Informa
  tion Science and Technology, 2011, 62(3): 449-466.
  [4]肖明,李国俊,袁浩等. 国外情报学研究前沿可视化分析: 基于JASIS&T(2000-2009年)的引文耦合分析[J]. 图书情报工作,2011, (2): 1-5.
  [5]王林,冷伏海.施引关键词与被引作者交叉共现分析方法及实证研究[J]. 情报学报, 2012, 31(4): 362-370.
  [6]朱星宇,陈勇强. SPSS多元统计分析方法及应用[M]. 北京: 清华大学出版社, 2011.
  [7]刘军. 整体网分析讲义[M].上海:格致出版社, 2009.
  [8]张自立,张紫琼,李向阳等. 基于2-模网络的科研单位和关键词共现分析方法[J].情报学报,2011, 30(12): 1249-1260.
  作者简介:周丽英(1979-),女,中国农业大学图书馆馆员,中国科学院国家科学图书馆情报学博士研究生;冷伏海(1963-),男,中国科学院国家科学图书馆研究员,博士生导师。
其他文献
按照《辽宁省关于加强现代农业示范区建设意见》的总体目标和建设布局,即“十二五”期间,在辽宁省重点建设10个大型的、跨区域的现代农业示范区。其中,阜新市阜蒙县和彰武县两县
运用CodonW程序对拟南芥NHX基因密码子组成、同义密码子使用频率和全长编码区密码子使用各项参数的计算和统计分析.结果表明:密码子适应指数(CAI值)与最优密码子使用频率(FOP)、密
实施兽医行业就业准入,对兽医行业专门岗位进行技能鉴定,具有重大意义。畜牧兽医行业就业准入制度的实施,将以职业技能培训、鉴定为手段,培养和造就一支高素质的防疫检疫队伍,它对
针对现有IP网络性能监控方案把逐段的网络管道作为监控对象而无法实现端到端性能监控的问题,文章提出了一种业务流识别以及把业务流作为监控对象的IP网络性能监控方案.该方案通