基于数据挖掘算法的作者名称清洗及构建科研评价系统

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:zhongminghe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学是将数学、计算机科学等领域的科学理论、应用技术等应用于生物科学,以达到了解生物数据的目的的一种跨学科前沿科研领域。第一生产力的科技,已然成为改善人类的生活质量、推进社会进程的重要力量。对于如此重要的领域,有效合理的科研评价体系成为大家研究的焦点问题。国内外对于科研人员的评价,从多种多样的角度出发,建立了众多评价指标。社会网络分析方法广泛的应用于各个领域,如机构合作关系、作者合作关系以及文献引用关系等。社会网络分析软件伴随着社会网络分析的发展而发展。开源软件Gephi目前已经可以处理十万个结点的图形网络,并将其按着不同的需求,运用不同的算法,对数据进行直观的可视化展示。  中国科学院微生物研究所的部门网络中心在长期的发展中,积累了大量的关于生物信息的数据资源:  1.本文从这些数据中,挑取优质的文献数据,综合运用计算机算法,如动态规划计算编辑距离、并查集算法等,提取、清理数据,建立了统一作者库。  2.基于统一作者库,针对微生物领域的科研人员,建立了多维度科研评价模型。此模型包括两部分:基于公式的评价模型与基于关系网络图的评价模型。以上分别从微观与宏观即个体以及整体进行了分析与评价。  3.除此之外,还对研究实体菌株与研究领域进行了分析与评价。将微生物领域中的研究点或特征与科研人员信息相结合,做出了针对于菌株以及科研领域的多维度评价模型。同时利用菌株与科研领域的从属关系制作了做了从属关系网络图。
其他文献
全过程计算机辅助动画自动生成技术是一种新的基于人工智能的动画生成技术,主要研究的是将人工智能技术引入动画生成的全过程,该技术从用自然语言书写的故事开始,直至最终生成动
行人重现识别是指在监控摄像网络中发现特定目标行人的任务,相关研究成果可用于安全监控和智能侦查等领域。该问题对于国家安全具有重要的意义,其研究具有较好的理论意义和应用
虚拟化技术的出现拯救了复杂多样的硬件平台与多种多样的操作系统之间、或者多种操作系统与基于系统的应用开发之间的复杂性。例如,随着高级语言虚拟机JAVA虚拟机的出现,JAVA
软件复用是提高软件开发效率和软件质量的一种有效手段。研究和实践表明,在特定领域内对软件资产和经验进行复用更易获得成功。特定领域内的软件复用包含领域工程和应用工程两
随着人们生活水平的不断提高,对于电视、电影、三维游戏中的特效真实感的需求也不断增强,水的模拟在其中应用非常广泛,因此图形学中流体模拟领域一直都是研究的热点。但与此同时
网络教学是现代教育技术综合应用中的一个重要领域,也是实现教育信息化的重要手段。随着信息化时代的不断向前发展,各个高校的校园网建设也已经初具规模,顺应教育教学体制改革的
随着Internet的快速发展,以Web应用为主要形式的网络服务已成为现代社会不可或缺的重要组成部分,保障网络服务的正常运行并有良好的服务质量十分关键。软件故障诊断技术是一种
语种识别是指计算机自动判定一段语音所属的语言种类的技术,在近几年中,其应用需求显著增加。语种识别中的一个重要研究问题是提取语音的语种鉴别性信息。一般来讲,一个成功的语
人类已经迈入二十一世纪,信息化、智能化已经成为当今的热门话题,无论是在金融、医疗、军事、教育等各领域都在实行着信息化、智能化的革新。如何运用先进的技术实现现代化的管
面向服务的体系结构是一个广泛应用于企业级软件架构的模式。它通过将不同功能抽象为服务,通过使用接口将服务与服务联系起来。这样的体系结构满足现今对功能解耦的需求。于