基于用户行为序列的推荐系统研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:yucol
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网诞生于美国少数几所学校和科研机构中,随着技术的发展,互联网慢慢地融入到人们的日常生活中。从互联网诞生初期到今天,互联网以惊人的速度在用户身边蔓延开来,因此导致了各种数据爆炸式增长,中国已经从一个信息匮乏的年代步入到一个信息过载的时代。社交网络、微博、微信、豆瓣、维基百科以及视频共享等网站的迅速增加,为用户提供了情感表达的平台,因此导致的如何在大量的信息中寻找用户感兴趣的信息,提高信息的利用率至关重要。各大社交网站在面临着如何在海量的信息中挖掘出对用户有用的信息等困难,在这种背景下推荐算法应运而生,旨在解决用户面对纷杂信息如何进行挑选的问题。  作为推荐算法中最重要的个性化推荐成为现在研究的热点,而且在电子商务和社交网络中扮演着越来越重要的角色。如何利用用户的心理特征对用户进行个性化建模至关重要。通过用户的历史行为数据刻画人物性格特征,能够刻画出隐藏在数据后的潜在特征,从而提升推荐算法的准确率和用户在使用过程中的满意度,同时深度学习通过调整模型参数能够学习到数据的潜在特征,将深度学习与个性化推荐进行结合,不仅考虑到了用户和商品的本身的特征,而且还考虑到了用户的喜爱偏好,在本文中将深度学习与个性化建模进行结合,开展了一种基于用户行为序列的推荐系统研究。  本论文分为以下三个研究点,每个研究点的创新如下:  针对单领域数据不能够充分刻画用户猎奇行为的问题,提出了基于贝叶斯模型的跨领域行为序列推荐算法(CDNST,Cross Domain Novelty Seeking Trait)。该方法利用跨领域数据对用户的猎奇行为进行建模,缓解了单领域推荐中存在的数据稀疏性导致的推荐不准确和冷启动问题。在该算法中通过共享用户的猎奇状态,利用更多的数据对用户进行建模,从而能够更加精准地刻画用户的猎奇心理,从而提高推荐的准确率,增加用户的满意度。本研究点从豆瓣上爬取的真实数据集上对CDNST算法的有效性进行了验证。  针对推荐算法忽略用户个人偏好的问题,提出了基于深度学习的行为序列推荐算法(DSMF,Deep Sequential Matrix Factorization)。该方法不仅考虑了用户或物品之间的关联性,还考虑到了用户前若干次行为对后面行为的影响。本研究点中引入了用户前若干次评分反映用户评分习惯这一特征,从而挖掘用户评分习惯对将要预测评分的影响,从而使得推荐更加精准。最后,利用公开数据集MovieLens数据集对DSMF算法的推荐的准确性进行了验证。  针对为用户推荐手机应用忽略用户对手机应用类型偏好的问题,提出基于猎奇心理在DPI(Deep Package Insection)行为序列的手机应用推荐算法(DPIR,Deep Package Insection Recommendation),并提出了一种高效的从DPI数据中提取用户使用手机应用行为的方法,利用在线搜索工具动态更新手机应用库代替了人工挖掘手机应用库的方式识别DPI数据中手机应用名称,从而提高了识别的准确率和召回率。同时利用识别的手机应用数据,提出了基于猎奇心理在DPI行为序列的手机应用推荐算法(DPIR)对用户使用的手机应用进行推荐,提升了用户使用手机满意度。最后利用广东电信提供的数据验证了DPIR模型推荐的准确性。
其他文献
格式化文档漏洞的逐渐增多使得恶意文档越来越多地被用来攻击,恶意文档具有隐蔽性强、破坏性高、检测难度大等特点。本文通过对恶意文档的攻击方式、组成结构和攻击代码所采用
狼的存在,马鹿开始选择锻炼奔跑,自然选择会让孱弱的个体在竞争中被淘汰,留下的狼和鹿都越来越矫健。网络安全技术亦是如此,没有免杀技术而只有反病毒的世界,所谓“发展”和“提高
随着互联网的迅速普及,电子邮件已经成为现代通信的主要手段之一。然而垃圾邮件的泛滥也引起了人们的高度重视,垃圾邮件不仅耗费用户的时间和精力、占用大量的网络带宽和存储
随着互联网的飞速发展,多元化信息的膨胀,传统的通用搜索引擎已经不能满足人们对个性化信息检索服务日益增长的需要,因而垂直搜索引擎应运而生。垂直搜索引擎是相对通用搜索
数据挖掘自从诞生至今,已被运用于许多领域,并且得到了很好的验证,显示出了重要的社会与经济价值。   在高校招生规模逐步扩大与信息技术飞速发展的今天,我国各高等学校皆建立
伴随着计算机技术的发展,用户界面经历了一次次的变革。基于WIMP界面范式的图形用户界面以“所见即所得”的桌面隐喻方式表达计算机复杂、抽象的指令,成为划时代的革命。然而,随
随着软件复杂度的增加,软件开发过程的规范化要求越来越严格,需要记录的活动过程和阶段性成果也越来越多。作为以记录软件开发过程中的活动和阶段性成果为研究对象的软件编档研
嵌入式系统被大量的用在人们的生活与工作中,在家用电器、工业控制、汽车、掌上设备中都有大规模应用。不同于传统的软件开发,嵌入式软件开发的目的更专一,因为嵌入式系统有
随着数据库技术的发展与普及,各个领域的数据库中积累了大量数据。如何从数据中获取为决策服务的有价值知识是人们所关注的。因此,近年来在人工智能领域中数据挖掘成为了一个
无线传感器网络作为一种新兴的应用型网络,由大量的传感器节点组成,具有覆盖范围广、成本低、自组织性和以数据为中心等优点,必将得到越来越广泛的应用。而生物实验室是一类科学