论文部分内容阅读
互联网诞生于美国少数几所学校和科研机构中,随着技术的发展,互联网慢慢地融入到人们的日常生活中。从互联网诞生初期到今天,互联网以惊人的速度在用户身边蔓延开来,因此导致了各种数据爆炸式增长,中国已经从一个信息匮乏的年代步入到一个信息过载的时代。社交网络、微博、微信、豆瓣、维基百科以及视频共享等网站的迅速增加,为用户提供了情感表达的平台,因此导致的如何在大量的信息中寻找用户感兴趣的信息,提高信息的利用率至关重要。各大社交网站在面临着如何在海量的信息中挖掘出对用户有用的信息等困难,在这种背景下推荐算法应运而生,旨在解决用户面对纷杂信息如何进行挑选的问题。 作为推荐算法中最重要的个性化推荐成为现在研究的热点,而且在电子商务和社交网络中扮演着越来越重要的角色。如何利用用户的心理特征对用户进行个性化建模至关重要。通过用户的历史行为数据刻画人物性格特征,能够刻画出隐藏在数据后的潜在特征,从而提升推荐算法的准确率和用户在使用过程中的满意度,同时深度学习通过调整模型参数能够学习到数据的潜在特征,将深度学习与个性化推荐进行结合,不仅考虑到了用户和商品的本身的特征,而且还考虑到了用户的喜爱偏好,在本文中将深度学习与个性化建模进行结合,开展了一种基于用户行为序列的推荐系统研究。 本论文分为以下三个研究点,每个研究点的创新如下: 针对单领域数据不能够充分刻画用户猎奇行为的问题,提出了基于贝叶斯模型的跨领域行为序列推荐算法(CDNST,Cross Domain Novelty Seeking Trait)。该方法利用跨领域数据对用户的猎奇行为进行建模,缓解了单领域推荐中存在的数据稀疏性导致的推荐不准确和冷启动问题。在该算法中通过共享用户的猎奇状态,利用更多的数据对用户进行建模,从而能够更加精准地刻画用户的猎奇心理,从而提高推荐的准确率,增加用户的满意度。本研究点从豆瓣上爬取的真实数据集上对CDNST算法的有效性进行了验证。 针对推荐算法忽略用户个人偏好的问题,提出了基于深度学习的行为序列推荐算法(DSMF,Deep Sequential Matrix Factorization)。该方法不仅考虑了用户或物品之间的关联性,还考虑到了用户前若干次行为对后面行为的影响。本研究点中引入了用户前若干次评分反映用户评分习惯这一特征,从而挖掘用户评分习惯对将要预测评分的影响,从而使得推荐更加精准。最后,利用公开数据集MovieLens数据集对DSMF算法的推荐的准确性进行了验证。 针对为用户推荐手机应用忽略用户对手机应用类型偏好的问题,提出基于猎奇心理在DPI(Deep Package Insection)行为序列的手机应用推荐算法(DPIR,Deep Package Insection Recommendation),并提出了一种高效的从DPI数据中提取用户使用手机应用行为的方法,利用在线搜索工具动态更新手机应用库代替了人工挖掘手机应用库的方式识别DPI数据中手机应用名称,从而提高了识别的准确率和召回率。同时利用识别的手机应用数据,提出了基于猎奇心理在DPI行为序列的手机应用推荐算法(DPIR)对用户使用的手机应用进行推荐,提升了用户使用手机满意度。最后利用广东电信提供的数据验证了DPIR模型推荐的准确性。