基于UGC挖掘的学术虚拟社区知识推荐研究

被引量 : 0次 | 上传用户:lmjgood520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网时代,信息技术的发展为人们带来学习、生活、工作的便捷。通过网络,人们获取知识的渠道和途径大大拓展,虚拟社区便是其中的一种。虚拟社区为人们的信息交流提供了平台。随着信息交流内容的不断细分,学术交流的网络化成为一种趋势,受到学者的重视。更多的学者也倾向于通过互联网络来弥补现实学术交流的不足。学术虚拟社区以其快捷性、开放性吸引了越来越多重量级学者参与,它不仅满足了信息交流细分下学者对学术交流的需求,同时也成为传统学术交流在网络上的扩展和延伸,逐渐成为专业人士、科研工作者分享信息与知识的重要平台。知识交流与共享是学术虚拟社区存在与发展的基础。随着学术虚拟社区用户交互、社区知识量的几何级数增长,学术需求者如何与学术贡献者互动,学者如何高效、准确、快速地获取想要的知识,同时寻找在学术研究中的志同道合者,如何提高学术虚拟社区的知识交流与共享度,都是现阶段对于学术虚拟社区研究需要考虑的问题。本论文基于对学术虚拟社区、用户生成内容(UGC)、Web数据挖掘、知识推荐等相关研究的学习,通过对学术虚拟社区和UGC研究,对其概念分别进行了界定,提出了学术UGC概念,从内容、用户和链接的维度分析了学术UGC不同于其他UGC的特性。将Web数据挖掘中的内容挖掘和结构挖掘用于学术UGC的挖掘中,使用基于语义加权的K-均值聚类实现学术UGC内容的挖掘,并建立了学术虚拟社区显性知识推荐模型;优化学术虚拟社区中用户距离的计算方法,推导出改进后的PageRank2.0算法进行学术UGC链接挖掘,建立了学术虚拟社区隐性知识推荐模型,为用户推荐具有相同研究兴趣的其他用户。最后,使用UChome网站建设工具搭建了以“数据挖掘”为主题的学术虚拟社区,共分析23个用户共250篇博文。通过对250篇博文做文本和链接分析,进行文本聚类和用户权威度计算。学术UGC经过文本预处理和特征表示后,对各博客的特征表示集合进行文本相似度计算并得出相似矩阵,最后对相似矩阵采用K-means算法进行聚类;对学术UGC中的入链链接进行分析,并列出入链链接矩阵,算出每位用户的权威值,将学术UGC聚类后的用户中的权威推荐给相关领域用户,这是一种隐性的知识推荐方式。这种知识和知识源(“学术权威”)的知识推荐,能够促进“学习者”进行知识交流与共享,推动整个学术社区知识存量的螺旋式上升。
其他文献
介绍了在数字通信系统中自动增益控制(AGC)的设计与实现。由于接收信号比较微弱,必须用多级放大,本次综合整个系统的性能,最后采用AD603可变增益放大器的两级级联方式再和AGC
新课程改革倡导学习方式的转变,教师的任务不再是单纯地传授知识,还要指导学生形成适合自己的学习方法,使学生拥有学习的主动权,并使学生自己能够积极地去寻求知识、发现问题
研究目的:扁平足和内翻膝是常见的下肢畸形,并且会给患者带来严重后果,影响到人们的健康生活。本文拟通过分析扁平足和内翻膝受试者在步态特征中与正常人群的异同处,及使用矫
在“循环经济”、“低碳经济”、“可持续发展”等思想理念的引导下,节能环保产业营运而生。2012年,我国政府把节能环保产业列为七大战略性新兴产业之首,并提出“十二五”期
改革开放以来,我国生产力大幅提升,人民的生活水平也有了显著提高。但是,目前收入分配问题又成了制约我国经济发展的另一道障碍。本文通过研究我国收入分配的现状,来探索我国
本文研究了用镧盐或钡盐处理石墨管,以铝盐或钙盐作为基体改进剂来测定水样中的铍,这能消除基体干扰,从而建立了一个测定河水中微量铍的准确、快速、简便的分析方法。 In t
庐山宗教旅游资源极其丰富且极富特点,对庐山旅游的发展起到了积极的历史作用,但在对其的开发利用过程中仍然存在很多问题。本文基于对庐山宗教旅游资源特点的分析,从体制、
在对各种太阳能低温发电系统广泛调研的基础上,搭建了系统平台。本文论述了8种有机介质不同物性对系统效率的影响,实验分析和优化了系统要设定的参数。针对普通太阳能热水器提
2004年高中开始进行课程改革,至2010年全国所有地区均已进入新课程实验。高考随之也做出相应改革。从2007年新课改后的理综(生物)首次亮相,至今已经历了6年。生物是一门实验
在西方哲学史上,哲学家们对真理的探求从未停止过,真理问题包含着对人的生命状态以及人的最高幸福的沉思。尼采的真理观正是以生命为基础建构起来的生存主义真理观。他认为真理