基于标签的推荐系统模型及算法研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:hxm020101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web2.0的出现使得Web上出现一种新形态的系统:标签系统,如Delicious、Flickr、Youtube、Facebook。在标签系统中用户可以任意上传资源,并且允许使用任意的称为标签的文字对资源进行标注。由于其具有UGC (User Generate Content)及自由打标签(Free Tagging)的特征,使得标签系统中存在“信息过载”、“信息迷向”、“垃圾标签”、“搜索精度低”等问题。解决“信息过载”等问题通用的方法是采用个性化推荐技术,因此本文将研究基于标签的推荐系统。传统的推荐系统采用协同过滤技术,其基于用户-评分矩阵,研究对象是用户-项目两维系统。而标签系统是三维的系统:用户-标签-项目。为了简化研究及运用传统的推荐技术,本文通过映射把三维的系统转化为三个两维的系统:用户-用户、项目-项目、标签-标签。其中针对用户-用户关系提出了基于标签的用户模型、基于TF*IDF的用户模型、用户对项目的喜好度评估算法、基于用户兴趣划分的协同过滤推荐算法;项目-项目关系讨论了项目相似度的计算、基于项目的协同过滤推荐算法;标签-标签关系讨论了基于共现性的标签关系度量、基于社会关系的标签推荐算法。以上研究在一定程度上解决了标签系统中存在的各个问题。本文通过实验分析,验证了文章中提出的模型及相关算法的有效性,并根据实验提出了面向用户的推荐策略。
其他文献
人口红利消失是制约中国对外贸易发展的重要原因,而互联网能够成为提升贸易福利的主要引擎。本文在借鉴Redding(2016)模型的基础上构建互联网内生贸易模型,将互联网和人口红
基于北京市"城中村"微观调研数据,本研究对农民工住房需求特征进行分析,测算出农民工住房需求具有较低的收入弹性,发现社会融合度是重要的影响因素并且该影响存在群体间差异
有些代数问题,如用纯代数方法求解往往比较困难,但通过适当的换元,变成三角问题求解,不但可以简化书写过程,而且能使数量系明朗化,从而化难为易,找到解决问题的途经。代数问
过饱和度是糖液结晶过程中的主要测控参量.本文报道一种新型的光电检测法在线测控糖液过饱和度的原理与方法,给出其理论模型、系统构成和在单晶冰糖结晶工序上的应用结果.
随着城市化的迅速发展,在过去的十年里,食品废物已经逐渐成为一个公认的棘手的环境问题,为了增加食品垃圾对环境的总影响,将食品垃圾对生态环境的负担降到最低成为非常重要和严峻的一项任务。逆向物流系统是“资源—产品—再生资源”的闭环型物质流动系统。逆向物流是现代物流供应链中不可缺少的一部分,它与正向物流一起构成循环的物流体系。逆向物流是一项复杂的活动,它需要专业的人员进行管理和协调,而且开展食品逆向物流会
随着社会的发展,对电能的需求日趋增多,配电网的建设规模也日趋扩大,配电网的结构日趋复杂,配电网产生的电能损耗也越来越大,使得降低电能损耗的意义更重大。在整个配电网产
文章探析了多元化战略的二维模型、业务多元化、地域多元化、业务多元化与地域多元化的综合影响,并得出结论。
长链非编码RNA(long non-coding RNA,LncRNA)是指一类长度超过200个核苷酸而不编码蛋白的RNA。LncRNA与生物学功能密切相关,可在转录水平、转录后水平及表观遗传水平上调控基
中部崛起战略为中部各省发展经济提供了良机。人力资本水平的提高是国家财富和个人收入持续增加的根本动力。丰裕的人力资本为湖北构建促进中部崛起的重要战略支点提供了得天
这篇论文是关于小说《一切皆有可能》(节选)的翻译报告,作者是伊丽莎白·斯特劳特。这篇小说探索了各个人物内心深处的世界,描写了人类情感冲突和精神愉悦,小说也刻画了人物