论文部分内容阅读
随着互联网技术的快速发展,用户行为数据被大量的记录下来,利用用户行为数据对用户兴趣建模是很多应用的基础。研究基于多源信息融合的用户兴趣建模技术具有重要的理论价值和实践价值。理论上,基于多源信息融合的用户兴趣建模面临着隐式反馈、上下文敏感等挑战;实践上,研究用户兴趣建模可以用于个性化信息服务,有助于减少信息过载对用户的影响,还可以用于危险用户识别,有助于网络安全监管。 针对用户兴趣建模问题,展开了以下工作:(1)基于隐式反馈环境下的多源信息融合用户兴趣建模与应用;(2)基于上下文敏感环境下的多源信息融合用户兴趣建模与应用;(3)基于PA学习的多源信息融合算法的在线扩展的相关研究。三个研究点的内容与贡献归纳如下。 1.基于隐式反馈环境下的多源信息融合用户兴趣建模与应用。该部分主要研究用户评分数据为隐式反馈数据时的用户兴趣建模问题,该问题主要的挑战在于训练数据没有负样本以及训练数据非常稀疏,针对这些挑战,利用用户的群体兴趣对个体兴趣进行增强,并且利用基于贝叶斯个性化排序的方法进行模型训练,最后以音乐推荐问题为应用背景证明了算法的有效性。 2.基于上下文敏感环境下的多源信息融合用户兴趣建模与应用。该部分将用户兴趣建模放到上下文环境下进行考虑,需要解决上下文信息与用户评分信息的融合的问题,针对该问题,利用矩阵联合分解的方法,为了不失一般性,在例子中同时考虑了两种独立的上下文信息以及隐式用户反馈信息,事实上该方法可以扩展到多种上下文环境中。最后,以事件型社交网络上的好友推荐问题作为应用背景,以地理位置和社交关系作为上下文,实验结果证明了算法的有效性。 3.基于PA学习的多源信息融合算法的在线扩展。该部分主要研究上述两部分算法的在线训练问题,在线学习可以利用已有模型和新到来的数据增量式地更新模型,适用于数据流的情形。采用了在线PA(passive-aggressive)学习框架,实现了算法的在线扩展,该模型同时考虑了上下文信息和隐式用户反馈数据。最后以事件型社交网络上的好友推荐为应用背景,通过模拟数据流环境证明了算法的有效性。