论文部分内容阅读
信息时代的到来及互联网的飞速发展,人们需要从海量的信息中找到符合自己需要的有价值的信息,此时产生了搜索技术来解决用户寻找信息困难的问题。随着web2.0时代的到来,用户角色从单纯的网络信息获取者转变为信息的创造者及提供者,大大提高了互联网的参与度。如何发现用户创造的具有价值的信息,并提供给其他用户使用,渐渐成为了学术界与企业界的研究热点,由此产生了推荐技术,用来对用户数据进行分析,在分析基础上产生符合用户兴趣爱好的推荐项目。 推荐技术中最被广泛使用的是协同过滤推荐,它是基于兴趣爱好相近的用户群对同一个项目或者相近的项目具有相似的兴趣偏好的假设,这样就可以通过寻找与目标用户相似的用户来产生推荐项目,充分利用群体的信息来为个体所服务,将个人的预测依托于群体的数据的分析基础上。 但是,协同过滤算法自身存在着一些问题,其中比较突出的就是稀疏性及冷启动的问题。本文尝试通过引入稀疏表示来解决稀疏性问题,引入社会化标签来解决冷启动问题。稀疏表示是在信号与图像处理领域被广泛使用的信号表示方式,由于其对噪声特征具有鲁棒性和对信号信息具有较好判别性的特点,可以应于用稀疏性的协同过滤算法矩阵中,来提升算法的推荐效果。社会化标签是用户对感兴趣的项目进行的个性化标识,具有表示用户特征的效果,可以用来作为判别用户间相似性的方法,将其应用于推荐系统中,可以提高推荐的准确性。 本文将提出的基于稀疏表示及社会化标签优化的协同过滤算法在数据集上进行实验,表明该改进与传统的推荐相比,具有更好的效果。