【摘 要】
:
个性化推荐技术主动向用户推荐其可能感兴趣的物品集合,是缓解信息过载问题的有效手段,对于大数据背景下互联网应用具有重要意义。协同过滤是目前应用最广泛、最成功的推荐算法,获得了学术界和工业界的广泛关注并取得了一定的成果,但是仍然存在评分稀疏性而导致的相似度计算和邻居选取欠准确的问题,影响推荐效果。本文针对协同过滤算法存在的评分数据稀疏性展开相关研究,以期获得更好的推荐质量。本文主要的研究内容包括:1.
论文部分内容阅读
个性化推荐技术主动向用户推荐其可能感兴趣的物品集合,是缓解信息过载问题的有效手段,对于大数据背景下互联网应用具有重要意义。协同过滤是目前应用最广泛、最成功的推荐算法,获得了学术界和工业界的广泛关注并取得了一定的成果,但是仍然存在评分稀疏性而导致的相似度计算和邻居选取欠准确的问题,影响推荐效果。本文针对协同过滤算法存在的评分数据稀疏性展开相关研究,以期获得更好的推荐质量。本文主要的研究内容包括:1.针对现有的协同过滤方法在计算项目相似度时大多使用用户项目评分信息,忽略了项目标签信息的情况,提出一种结合评分和标签的协同过滤推荐算法。该算法在项目协同过滤的基础上,引入项目标签数据,利用项目标签隶属度和项目受欢迎程度计算项目间的相关性,并基于评分和标签改进了相似度计算策略。实验结果表明该算法优于现有的一些改进算法。2.针对目前协同过滤算法大都是基于评分数据产生综合兴趣,忽略了用户偏好的侧重点的问题,提出一种基于标签兴趣度的协同过滤算法。该算法通过用户标签使用频度和用户标签评分共同分析用户对标签的兴趣度,以衡量用户偏好的侧重点,利用修正的标签兴趣度改进相似度计算方法。实验结果表明所提出的算法提高了评分预测的准确度,取得更好的推荐效果。3.针对现有的协同过滤算法根据评分相似度或者信任度选取邻居用户时,忽略了用户偏好的侧重点以及信任关系非对称性的情况,提出一种结合标签和信任度的协同过滤算法。该算法利用用户标签兴趣度计算用户相似度,同时通过评分数量度量用户的信任权重,构建信任关系的非对称性,分别根据用户间的相似度和信任度选取邻居用户。实验结果表明改进后的算法提高了推荐的准确度,并且一定程度上改善了冷启动带来的问题。
其他文献
在岩移观测站的全面观测中,传统的观测方法存在野外观测工作量大,观测时间长,内业计算较为繁琐.如果用全站仪进行全面观测,通过对观测值进行解算即可求出各参数计算所需数据,
研究背景与目的:神经炎症(neuroinflammation)是中枢神经系统(central nervous system,CNS)损伤和疾病的共同病理特征,其病理变化主要包括神经胶质细胞活化,炎性细胞浸润,促
本文应用经典博弈模型对腐败与监督博弈进行了分析,揭示了"激励悖论",在"激励悖论"的指导下,笔者对如何加强反腐监督提出了建议.
在官制系统中,比部很少被提到,但比部是一个重要的政府机构。然而由于史籍记载简略,人们多所猜测。考证说明:魏晋至隋,比部是一个法制机构;唐代比部是个审计机构。
老舍小说以幽默见长,老舍本人也被赋予了“幽默大师”的称号,因此老舍小说研究中关于幽默的文章很多。幽默只是喜剧中的一个高级形式,老舍小说中存在着多种喜剧因素,包括幽默
以2003年、2013年两期森林资源二类调查小班数据以及2009年森林资源年度更新数据为基础,提取出衡阳盆地2003、2009、2013年三期土地利用/覆盖数据,在IDRISI17.0软件支持下,利
中国电影是中国现代化和城市化历史进程的产物,城市电影和乡村电影中城市空间和乡村空间是表现中国城市化进程的两个切面。中国当代乡村电影中显著的两种乡村空间形态是作为
节能减排政策的深入实施,促进了以风电为代表的可再生能源发电装机容量迅猛增加,特别是在2005年出台《可再生能源法》后,到2014年风电容量从1260MW提高到114609MW以上。在200
<正> 八十年代的鲁迅研究在鲁迅研究史上无疑是一场革命,其意义不仅在于对传统思维模式、研究方法的革新,同时也在于对作为有“意味”的文的“形式”的发掘。传统研究习惯于
话剧这个源自欧洲的舞台样式,是以语言的音响形象为媒介,直接诉诸观众听觉的综合艺术。它是以人物对话和动作推进剧情表演和性格发展,与我国传统戏曲歌、舞、诗三位一体、综