循证理论在科技文献推荐中的应用研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：snoopy10222001

【摘要】

：

当前知识经济时代下，随着学术成果的蓬勃发展，科技文献资源数量急剧增长，这为科研用户发现和检索有价值的科研成果带来了困难和挑战，从海量信息中快速获取符合自身需求的相关文献

【作者】

：

曹元元

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2018年期

【关键词】

：

科技文献推荐系统循证理论证据体系相似度特征提取

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

当前知识经济时代下，随着学术成果的蓬勃发展，科技文献资源数量急剧增长，这为科研用户发现和检索有价值的科研成果带来了困难和挑战，从海量信息中快速获取符合自身需求的相关文献成为科研用户迫在眉睫的需求。针对这个问题，变被动服务为主动服务的科技文献推荐技术在数字图书馆中的应用被提出来。目前，对科技文献推荐的研究主要以基于内容的推荐、基于协同过滤的推荐、基于引文的推荐、基于社会网络的推荐作为主要的研究切入点[1]。这些研究主要从两个思路解决问题，一个是在隐空间内建模用户和文献的相似度;另一个是通过提取特征，利用机器学习算法模型刻画用户和文献的相似程度从而进行推荐[2]。这两种类型的推荐，从效果上来看都不错，但也存在很多不足。比如难以解释推荐结果，为什么会推荐这篇文章而不是那篇文章，有哪些特征比较关键，特征能否按重要性进行分层分级等。为了解决科技文献推荐的可解释性以及特征分级问题，本文尝试将医学上广泛应用的循证理论引入到科技文献的推荐过程中，实验表明基于循证的科技文献推荐效果不错，不仅能解释推荐结果，而且能对推荐特征按重要性程度进行分层，使重要特征一目了然。本文的贡献主要包括以下几个方面:　　1.为了解决科技文献推荐系统不具有可解释性问题，本文在保证高推荐精准率的前提下，将起源于医学，又在管理学、教育学、护理学、建筑学、信息服务、软件工程等领域得到广泛应用的循证理论纳入科技文献推荐研究中，力求探索该原理在科技文献推荐中的应用。本文利用循证理论，将特征类比为证据，多渠道广泛收集影响为科研用户推荐科技文献的证据，把来自不同的知识片段、来自多方面的信息进行整合，利用逻辑回归机器学习算法，对证据权重进行学习，并按照权重大小对证据进行分层，使文献推荐的证据等级较之传统推荐采用的研究方法更为严格，有效防止过多关注低级别证据中的固有缺陷和主观倾向。　　2.为了提高科技文献推荐的精准性，本文提出了一种基于循证理论的证据发现新方法。依据循证理论给推荐证据分级后，把影响推荐效果的重要关键证据提炼出来，并根据特征意义水平扩展出大量有用的特征。比如依据循证理论学习到的关键特征有“用户的年龄”，可以依据该特征意义，水平扩展出“用户的年龄区间”、“是否是青年人”、“是否是中年人”、“是否是老年人”等特征。将这些新挖掘的特征再加入到训练推荐过程中，实验证明这种自适应有方向的特征添加方法，能在很大程度上提高推荐精准性。　　3.本文探索性地将循证理论应用于科技文献推荐领域，找到二者之间的契合点，扩宽了科技文献推荐算法的研究思路，也扩展了循证理论的应用范围，并将统计学和机器学习的方法应用到其中，提出通过对特征即证据进行深入地数据挖掘，获得更具有针对性的科技文献推荐方案，促进科技文献推荐和循证理论两个领域的研究。　　本文的组织思路如下:首先对循证理论研究进行了探索和总结，对当前主要的推荐方法进行了调研和比较分析，梳理了现有的科技文献推荐方法，阐明了将循证理论纳入科技文献推荐中的适用性。之后，将科技文献推荐作为研究对象，以依据循证理论做科技文献推荐的总体思路为基础，构建了基于循证理论的科技文献推荐步骤和方法。同时使用公开数据集进行实证研究，通过对实验结果的分析，以及通过其与传统推荐方法的比较研究，文章得出如下结论:在大数据的背景下，基于循证理论的科技文献推荐方法是一种新探索，它与传统推荐方法之间有一定的关联性，也有一定的独立性，二者之间的关系不是替代性的，而是补充性的。通过证据分级，能解释科技文献推荐结果，且通过水平扩展重要特征，能提高推荐结果的精准性。在一定程度上，利用循证理论来做科技文献推荐涉及了现有推荐方法未涉及的到的一些特征层面。因此，有必要尝试将循证理论的思想纳入科技文献推荐研究中，以求更全面、生动地揭示科技文献推荐的特征，并对这些特征进行重要性程度的分级，进而提高推荐结果的精准度。

其他文献

人工智能时代科技期刊应对学术不端问题的研究进展

[目的]探讨当前人工智能时代下,科技期刊利用智能工具、大数据自动挖掘技术、人工智能分析技术,对存在的和可能发生的学术不端问题采取的相应措施.[方法]根据目前常见的学术

期刊

人工智能学术不端科技期刊剽窃伪造和篡改虚假同行评审区块链用户画像

以工程量清单为基础的电力造价研究

摘要：现代化的社会发展步伐不断加快，想要在今后的工作成绩上更好提升，必须努力提高电力造价的把控水平，既不能一味的压低，也不能一味的升高，要把控在合理的范围内，这样才能不断的创造出较高的价值。从客观的角度来看，电力造价工作的开展，要追寻新时代的要求及标准，不能总是停留在老旧的层面上。工程量清单的提出和应用，打破了传统的电力造价模式，能够对多方面的工作内容合理安排、执行，是一种非常不错的方法。本文针

期刊

工程量清单造价电力基础

公共图书馆面积规划研究

随着我国社会经济的不断发展,全国各地公共图书馆建设蓬勃发展,馆舍建设受到了各地政府的重视。这一方面反映了党和国家越来越重视公共图书馆存在的社会价值,另一方面也反映

学位

网络理论与方法在引文分析中的应用研究

引文分析在描述科学发展规律，揭示学科结构，为学术评价、科研管理提供客观标准，提供检索途径等方面具有不可替代的作用。但是到目前为止，我国大多数引文分析还是以同引理论为基础

学位

文献工作引文分析网络理论社会网络分析法

2014年10月钢材分国别(地区)进口情况

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

钢材累计金额哈萨克斯坦台湾省同比同期

“良师须具补天之手”——中国古籍修复:人才与队伍

我国古代文献典籍是中华民族在数千年历史发展过程中创造的重要文明成果,蕴含着中华民族特有的精神价值、思维方式和想象力、创造力,是中华文明绵延数千年,一脉相承的历史见

学位

古籍修复人员人才队伍古代文献典籍专业培训

档案网站信息资源整合方法、方案与实证

在信息时代的历史背景条件下，要真正实现档案信息资源的全面开发和充分利用，使之在信息社会中发挥更大的作用，其根本途径就在于对现有的档案信息资源进行整合，走档案信息资源的全

学位

档案网站信息资源整合方法信息化建设

2014年10月不锈板(带)分国别(地区)进口情况

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

累计金额台湾省同比同期

初中数学教学中如何培养学生的自主学习能力

新课标要求学生自主探索、合作交流、实践创新，做数学学习的主人。面对这一新的数学学习方式，我们教师要从根本上转变观念，摆脱传统教学模式的束缚，在培养学生自主学习的能力上动脑筋、下功夫，让学生热爱数学、探索数学，进而主动的去钻研、理解、想象，使他们在浓厚的兴趣中认识新知，掌握技巧。下面就谈谈我的一点粗浅看法。　　一、创设情境，激发学生的学习动机　　我国学者余文森认为，自主学习的主要含义，就是主动学习。

期刊

初中数学教学培养学生学生自主学习学生学习活动内在需要学习兴趣学习的主人自主探索转变观念主动学习责任学习方式学习动机教学模式基本品质

2014年10月无缝管分国别(地区)进口情况

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

无缝管累计金额台湾省同比同期

循证理论在科技文献推荐中的应用研究

其他学术论文