【摘 要】
:
推荐系统已经成为大数据时代最重要的信息过滤工具之一,它可以帮助用户从海量数据中迅速定位有价值的信息,并以用户可能感兴趣的物品列表的方式推荐给用户。互联网爆炸式的信
论文部分内容阅读
推荐系统已经成为大数据时代最重要的信息过滤工具之一,它可以帮助用户从海量数据中迅速定位有价值的信息,并以用户可能感兴趣的物品列表的方式推荐给用户。互联网爆炸式的信息量以及用户和物品数量的快速增长使推荐系统面临着诸多挑战,可扩展性便是其中的主要挑战之一。协同过滤是推荐系统领域应用最成功、最广泛的技术。目前,很多学者为了提升协同过滤算法的可扩展性,提出了多种基于聚类和基于并行技术的方案。通常,他们会在推荐算法的建模阶段使用全部的用户评分数据,而没有考虑这些数据的质量因素,而且已有的论文大都是针对基于近邻的协同过滤算法的可扩展性。本文从输入源数据集的角度出发,提出观点:并不是所有的用户行为数据都对最终的预测模型作出了同样的贡献,尤其是对那些拥有大量行为的活跃用户而言。本文认为,对于活跃用户,部分具备代表性的行为数据已经可以包含足够的信息来对用户作出准确的建模,在更短的时间内得到一个好的推荐结果。基于上述观点,本文首先通过一系列的实验探索了推荐算法建模阶段使用的用户行为数量和推荐算法性能之间的关系,提出了基于评分选取的推荐算法。特别地,本文的所有实验均同时考虑了评分预测和TopN推荐任务。随后,本文提出了一个综合考虑用户和电影两方面因素的通用评分选取框架,并且提出了基于划分的3种评分选取策略和基于统计学与信息论的5种评分选取策略,来为每一个用户选取其最具代表性的评分。最后,本文在MovieLens和Netflix数据集上做了大量的实验,实验结果表明仅使用活跃用户的部分代表性行为可以在达到预期推荐精度的同时降低算法的运行时间,由此提升了推荐系统的可扩展性,而且本文提出的方案适用于所有的协同过滤算法。
其他文献
以“面向以太网的物理帧时槽交换技术(Ethernet-oriented Physical Frame Timeslot Switching, EPFTS)"为核心的“单物理层用户数据交换平台的体系结构(Single-layer User-da
Web页面上用户的商品评论信息已成为影响电子商务消费者进行购买决策时的关键因素之一。近年来随着电子商务的发展,关于商品的评论信息呈指数级增长,从而导致潜在用户难以在
当特征的概念被引入到软件产品线开发过程之后,基于特征的领域分析与建模技术成为软件产品线开发中较为主流的需求建模方法,它为描述产品线共性和可变性及其之间的关系提供了
目前,SOA(Service Oriented Architecture,面向服务的构架)和Web服务技术已经被广泛应用于企业级商业开发中。而服务间通信的安全性问题已经成为制约SOA技术及Web服务继续发
近年来,随着计算机以及多媒体技术地快速发展,多媒体信息已经慢慢地走进了人们的日常生活当中。多媒体信息一般是以数字图像、音频、视频、动态图形以及文本等多种形式存在。
互联网和多媒体信息处理能力的不断发展,使得图像这一传统的多媒体信息载体被广泛应用和传播;与此同时,可以用来改善图像质量的处理软件也随之飞速进步,复杂的图像处理功能也
互联网的快速发展,加快了新闻的发布速度,也使得互联网成为聚集新闻信息最多、最全的地方,每日剧增的新闻信息更凸显出快速查找感兴趣内容的重要性,为了满足人们方便浏览新闻
现有的车载网络安全研究,在保密数据共享上,一般会采用群加密的方式来进行信息传输。但是群加密的方式应用在车载网络上有很大的限制。一方面由于车载网络的高度动态性,群组
随着互联网和计算机技术的高速发展,Web服务技术也得到了快速的发展和应用,这使得Web服务的数量与日俱增,提供的功能也越来越丰富。然而单个原子服务提供的功能毕竟有限,而用
人脸检测是指在任何人脸识别系统中从输入信息(图像)中确定所有存在的人脸的位置、大小和姿态的过程,它是自动人脸识别系统中的一个关键环节。随着计算机科学在人机交互领域的