论文部分内容阅读
随着技术进步、消费升级、相关政策法律以及版权市场环境的不断改善,中国影视文娱行业步入飞速发展时代,海量的媒资内容为在线视频行业和智能电视领域的发展带来了重大机遇,平台主要收入来源也逐渐由广告收入转变为以会员套餐为代表的用户付费。智能电视平台引入各视频平台媒资数据,为用户带来多种类型的会员套餐,极大的满足了不同用户的兴趣和需求,并为其带来了更优质的观看体验。然而在智能电视的应用场景中,电视终端常常由多名家庭成员共享,同一账号的播放历史涵盖了多名家庭成员的兴趣偏好,而不同成员的偏好通常存在差异。因此如何对智能电视共享账号的用户进行会员套餐推荐是本文需要研究的问题。传统的推荐方法一般是根据用户画像和用户行为历史对用户的表示和偏好建模后进行推荐,然而针对智能电视这种多用户共享账号的情况,多个用户的行为历史混杂在一起,据此生成的用户画像和用户表示侧重于该账号多个使用者的集体画像和整体兴趣偏好,难以正确反映某个具体使用用户的兴趣。目前存在一些共享账号的推荐方法,通常先对账号内用户进行识别,然后为识别出的用户进行推荐,然而,这类方法通常用于预测用户对某一特定视频的感兴趣程度,而套餐是多个付费视频的集合,会员套餐推荐要预测的是用户对套餐内视频集合感兴趣的概率,因此无法将其直接用于视频会员套餐的个性化推荐。综上所述,解决共享账号场景的视频会员套餐推荐问题将会遇到两点挑战:第一是如何从混杂在一起的用户行为历史中学习不同用户的表示和偏好;第二是如何通过用户行为历史对套餐表示进行学习。为了解决以上挑战,本文提出一种共享账号使用场景下的会员套餐推荐模型MUIN(Multi-User Identification Network for Video Membership Packages Recommendation),并基于与国内某大型智能电视平台的合作项目及该平台真实工业场景设计实现了智能电视会员套餐推荐系统,实现了 MUIN模型在工业环境下的集成。本文的主要工作和贡献概括如下:1.本文提出了一种共享账号使用场景下的会员套餐推荐模型——MUIN。MUIN模型基于账号视频播放会话,从跨会话和会话内两方面分别建模视频嵌入和会话表示。然后,通过会话到用户(Session-to-User,S2U)的动态路由方法将具有较高相似度的会话表示自适应地聚类成不同用户表示,从而获得共享账号多个用户的表示向量。接着,通过为套餐设置热度向量动态赋予套餐内视频不同权重,使热度更高的视频在套餐表示中占据更重要的地位。最后,通过用户当前会话与多用户表示向量获得该用户兴趣向量,利用用户兴趣向量和套餐表示向量预测用户对不同套餐感兴趣的概率。2.本文使用两个真实的智能电视数据集WASU和CIBN进行了大量实验,验证了MUIN模型的有效性。通过与基线方法的对比实验,显示出MUIN模型在精确率、召回率以及平均倒数排名等评价指标上取得更优的效果。通过消融实验,验证了 MUIN模型各个模块设计的必要性和合理性。不同路由方法的对比实验结果表明,本文提出的S2U动态路由方法相较其他路由方法在共享账号会员套餐推荐问题上具有更好的提升效果。3.本文设计研发了一个智能电视会员套餐推荐系统,实现了 MUIN模型在工业环境下的集成。该系统基于大数据框架Hadoop,分别从数据模块和推荐模块两部分进行设计和实现。数据模块使用Flume、Kafka、Spark等组件对账号的播放日志进行收集、处理,并根据使用场景,分别基于HDFS、Hive、Redis对不同数据进行存储。推荐模块包含模型离线训练、在线服务和推荐结果存储三部分,分别使用机器学习平台TensorFlow和TensorFlow Serving对模型进行分布式训练和线上部署,推荐结果使用内存数据库Redis存储,用于后续推荐服务。