论文部分内容阅读
由于互联网信息的快速增长,用户面临着信息过载的问题。借助数据挖掘和人工智能领域中的相关技术,推荐系统能够帮助用户快速找到其感兴趣的信息,在社交网络、电子商务、在线阅读和广告投放等领域得到了广泛的应用。随着互联网应用的多元化发展,传统的推荐模型难以直接运用到新领域中以解决相应的问题。
以智能手机,笔记本电脑等为代表的电子产品更新换代通常较为频繁,而用户对于此类产品的消费周期则相对较长。传统的推荐系统会根据用户之前的消费记录来进行推荐,这种情况下有些消费记录可能已经失去了时效性,无法提供足够的有效信息来推荐新项目。针对这一问题,本文决定从两个角度进行建模,即项目水平和用户水平。前者反映了项目的属性相对于同类竞品所处的档次,后者则反映了用户偏好的项目所处的档次。通过分析项目的属性变化趋势以及用户的消费行为特点,发现用户的偏好具有一定的稳定性,即用户在不同时期也会倾向于购买具有类似属性水平的项目。基于此,设计了两种新的相似性度量方法,然后利用它们来扩展隐特征模型得到两种新方法—基于项目水平相似度的矩阵分解算法(ILMF)和基于用户水平相似度的矩阵分解算法(ULMF)。此外还将这两种扩展方法结合起来,进一步研究这两种扩展方法对推荐结果的贡献程度。实验结果表明提出的方法在真实数据集上的表现优于对比方法。
不同于传统的推荐任务,兴趣点推荐是指在特定时空背景下,预测目标用户感兴趣的地点。兴趣点推荐不仅能让用户获得更好的访问体验,还能让服务提供者根据用户的反馈信息进行改善。兴趣点推荐需要充分考虑用户的访问行为特征,而用户的访问行为受到地理、时间等因素的影响,同时还具有群体性特征。因此如何合理地将这些影响因素融入统一的兴趣点推荐框架中是一个巨大的挑战。为了解决这个问题,首次提出了一种基于分组的兴趣点推荐方法GTSAR-RNN,综合考虑了时间信息、评论信息、类别信息和地理信息。为了提高模型的针对性,根据访问数据将用户划分到不同的分组中,并为每组用户训练一个独立的神经网络来进行兴趣点推荐。GTSAR-RNN采用一种灵活的多分组策略将用户分到多个组中,每个组都会产生一个独立的推荐结果,而最终的推荐结果则是把不同分组的推荐结果进行整合。一个拥有多个兴趣倾向的用户会被分到多个分组中,由于对每个分组都进行独立训练,因此每个分组对应的神经网络都捕获了该用户的部分兴趣。采用这种独立训练的策略能够较好地兼顾推荐的个性化和多样性。实验结果表明GTSAR-RNN在真实数据集上的性能相较于对比方法有明显的提升。
传统基于预测评分的推荐系统通过计算项目属性与用户偏好的匹配度,然后向用户推荐匹配度最高的Top-k个项目。然而这种Top-k推荐策略,主要是从用户的角度来进行个性化推荐。生产商和销售商则希望推荐系统能够快速发现项目的潜在客户,从而采取针对性的宣传营销手段,以促进项目的销售。为了寻找项目的潜在用户,决定将反向Top-k查询引入到推荐系统中。现有推荐模型处理的都是确定数据,然而在现实生活中,用户在挑选产品时并不总是遵从某种特定规则,可能存在一定的随机性。捕捉用户偏好是推荐系统的一项核心任务,而当前的研究只考虑了不同场景下用户偏好的变化,忽略了同一场景下用户偏好也不确定的情况。因此本文首先对用户的不确定偏好进行建模,然后提出一种不确定偏好下的反向Top-k查询。为了提高查询效率,设计了RUI-tree来对用户的不确定偏好数据进行索引,并在此基础上提出了UPBBR算法。实验表明UPBBR算法在生成数据集和真实数据集上均优于其他对比算法,且表现出良好的延展性。
以智能手机,笔记本电脑等为代表的电子产品更新换代通常较为频繁,而用户对于此类产品的消费周期则相对较长。传统的推荐系统会根据用户之前的消费记录来进行推荐,这种情况下有些消费记录可能已经失去了时效性,无法提供足够的有效信息来推荐新项目。针对这一问题,本文决定从两个角度进行建模,即项目水平和用户水平。前者反映了项目的属性相对于同类竞品所处的档次,后者则反映了用户偏好的项目所处的档次。通过分析项目的属性变化趋势以及用户的消费行为特点,发现用户的偏好具有一定的稳定性,即用户在不同时期也会倾向于购买具有类似属性水平的项目。基于此,设计了两种新的相似性度量方法,然后利用它们来扩展隐特征模型得到两种新方法—基于项目水平相似度的矩阵分解算法(ILMF)和基于用户水平相似度的矩阵分解算法(ULMF)。此外还将这两种扩展方法结合起来,进一步研究这两种扩展方法对推荐结果的贡献程度。实验结果表明提出的方法在真实数据集上的表现优于对比方法。
不同于传统的推荐任务,兴趣点推荐是指在特定时空背景下,预测目标用户感兴趣的地点。兴趣点推荐不仅能让用户获得更好的访问体验,还能让服务提供者根据用户的反馈信息进行改善。兴趣点推荐需要充分考虑用户的访问行为特征,而用户的访问行为受到地理、时间等因素的影响,同时还具有群体性特征。因此如何合理地将这些影响因素融入统一的兴趣点推荐框架中是一个巨大的挑战。为了解决这个问题,首次提出了一种基于分组的兴趣点推荐方法GTSAR-RNN,综合考虑了时间信息、评论信息、类别信息和地理信息。为了提高模型的针对性,根据访问数据将用户划分到不同的分组中,并为每组用户训练一个独立的神经网络来进行兴趣点推荐。GTSAR-RNN采用一种灵活的多分组策略将用户分到多个组中,每个组都会产生一个独立的推荐结果,而最终的推荐结果则是把不同分组的推荐结果进行整合。一个拥有多个兴趣倾向的用户会被分到多个分组中,由于对每个分组都进行独立训练,因此每个分组对应的神经网络都捕获了该用户的部分兴趣。采用这种独立训练的策略能够较好地兼顾推荐的个性化和多样性。实验结果表明GTSAR-RNN在真实数据集上的性能相较于对比方法有明显的提升。
传统基于预测评分的推荐系统通过计算项目属性与用户偏好的匹配度,然后向用户推荐匹配度最高的Top-k个项目。然而这种Top-k推荐策略,主要是从用户的角度来进行个性化推荐。生产商和销售商则希望推荐系统能够快速发现项目的潜在客户,从而采取针对性的宣传营销手段,以促进项目的销售。为了寻找项目的潜在用户,决定将反向Top-k查询引入到推荐系统中。现有推荐模型处理的都是确定数据,然而在现实生活中,用户在挑选产品时并不总是遵从某种特定规则,可能存在一定的随机性。捕捉用户偏好是推荐系统的一项核心任务,而当前的研究只考虑了不同场景下用户偏好的变化,忽略了同一场景下用户偏好也不确定的情况。因此本文首先对用户的不确定偏好进行建模,然后提出一种不确定偏好下的反向Top-k查询。为了提高查询效率,设计了RUI-tree来对用户的不确定偏好数据进行索引,并在此基础上提出了UPBBR算法。实验表明UPBBR算法在生成数据集和真实数据集上均优于其他对比算法,且表现出良好的延展性。