论文部分内容阅读
随着互联网的快速发展,网上信息量越来越多,能为用户带来精准推荐的系统可以大大提升用户体验,个性化推荐算法成为了研究的热点问题。协同过滤是应用最广泛的推荐算法,它根据用户的历史行为数据对用户的兴趣做分析,进行相应推荐,但其研究中存在严重的数据稀疏问题,并且现有的算法对推荐的实时性考虑不足,这都是目前急需解决的课题。本文对当前的推荐算法进行研究,分析了当前推荐系统的研究现状,同时对深度学习在推荐系统领域的研究做了深入分析,意在将深度学习中栈式降噪自动编码器在自动特征提取方面的能力应用到推荐系统中,来缓解推荐系统存在的数据稀疏问题,同时提高推荐系统实时推荐的性能。为实现这一目的,本文做了多方面研究:(1)基本理论研究首先介绍了几种典型的推荐算法,并着重从协同过滤推荐算法入手,详细介绍了基于用户的协同过滤推荐算法和基于项目的协同过滤推荐算法。其次介绍了几个典型的深度学习框架,然后列举了几个典型的基于深度学习的推荐系统。(2)增量均模型及其改进研究通过分析本课题组前期提出的均模型及其增量扩展研究,发现在进行相似度计算时未考虑用户兴趣漂移问题,同时,在利用传统kNN方法选取近邻对象集时存在着一定的局限性,针对这两个问题,本文提出了一种动态选择的时间均模型。该模型引入近邻因子和时间函数,采用动态选择的方法选取项目的近邻集合,利用时间函数实现时间加权下的增量均模型改进。(3)时间均模型及其改进研究深度学习具有强大的特征提取能力,本文详细阐述了栈式降噪自编码器(Stacked Denoising Auto-Encoder,SDAE)的工作原理,并提出将其用于协同过滤推荐中学习用户(项目)的深层特征表示,但SDAE不能很好地利用用户对项目评分的时间属性。在(2)中提出的时间均模型,具有很好的处理大数据的能力以及实时推荐性能,但在特征提取过程中,由于数据稀疏问题的存在,会发生信息失真的情况。针对以上问题,提出了一种基于SDAE和时间均模型混合的协同过滤推荐算法,充分利用SDAE的自动特征学习能力以及时间均模型在大数据下的快速计算能力,较好地弥补了两者各自的不足之处。(4)均模型改进研究的实现本文在3个标准数据集上分别进行实验,通过对比传统方法和本文提出的方法来验证a)时间属性在实时推荐中的重要性;b)利于动态的方法选择用户(项目)近邻集合的必要性;c)将深度学习模型SDAE自动提取用户(项目)深层特征方面的优势应用到推荐系统中对推荐性能的影响。实验结果表明,本文提出的两种均模型改进方法进一步提高了推荐系统的推荐性能。