论文部分内容阅读
随着互联网技术迅猛发展,网络信息量呈几何式增长,为人们的日常生活带来了巨大的便利,但是同时这也给人们带来了信息过载的问题。在这种情况下,推荐系统应运而生,个性化推荐系统根据用户的兴趣偏好和需求等信息,从庞杂的互联网信息中获取用户感兴趣的内容并推荐给用户,在缓解信息过载的问题上扮演了至关重要的角色,成为了互联网时代不可或缺的技术应用,并广泛应用于各个领域。推荐算法作为推荐系统的核心,近年来备受学术界和工业界的关注和研究。协同过滤算法是当前应用最广泛的推荐算法。随着用户和物品规模的逐渐扩大,评分数据的稀疏性进一步增长。基于近邻的协同过滤算法,通过评分向量的相似度衡量用户或物品之间的相似性,算法的可解释性强,易于实现,然而在评分数据稀疏的情况下评分预测效果并不好,仍有较大的提升空间。矩阵分解作为基于模型的协同过滤算法具有良好的可扩展性,由于其良好的推荐效果,受到了广泛的关注。传统的矩阵分解技术通过用户潜在特征和物品潜在特征的内积来补全原始评分,进而进行评分预测,然而矩阵内积这样简单的线性交互函数,无法捕获用户与物品更深层次、更复杂的潜在特征表示。此外,与基于近邻的协同过滤算法不同,矩阵分解技术不具备良好的可解释性,无法将特征维度与实际生活中的概念相关联,只能将其理解为潜在语义空间。随着深度学习技术在计算机视觉、自然语言处理和语音识别等领域不断发展和突破,越来越多的研究人员将深度学习技术应用在推荐领域,既为推荐算法的研究带来了新的机遇也带来了挑战。针对上述问题,本文结合深度神经网络构建基于矩阵分解的评分预测模型,并基于此模型对传统的协同过滤算法进行改进,主要工作如下:首先,提出了一种基于深度神经网络的矩阵分解模型(DeepMF)。基于矩阵分解的推荐模型因为简单的使用线性交互函数-矩阵内积对用户和物品的交互关系进行建模而受到限制,针对这一缺陷,基于矩阵分解算法的思想,结合神经网络强大的非线性学习能力,从用户和物品的交互信息中,获取更深层次、更复杂、更抽象的潜在特征表示,同时结合各层神经网络获得的不同的特征信息进行评分预测,一定程度上避免了神经网络的特征变换导致的信息损失问题带来的影响。在几种公开的标准数据集上进行实验,实验结果表明该模型能够准确的获取用户和物品的潜在特征,并提升了评分预测的准确性。其次,提出了一种基于用户和物品双重聚类的协同过滤算法(DeepMF-DCCF)。传统的协同过滤算法在评分数据稀疏的情况下评分预测的准确性较低。针对这一问题,利用DeepMF模型对原始的评分矩阵进行填充。为了避免传统的K-Means聚类算法早熟收敛,结合模拟退火对K-Means算法进行改进。将评分相似度与特征相似度融合,以改进相似度计算方法,避免了单一的评分相似度对用户或物品相似关系描述不准确,进一步提高相似度计算的准确性。然后从用户和物品两个方向进行聚类,并结合填充后的评分矩阵,综合计算预测评分。实验结果表明,所提出的推荐算法有效的减少了数据稀疏性带来的影响,与传统的推荐算法以及DeepMF模型相比,进一步提升了评分预测的准确性。