面向视频的协同过滤推荐算法研究与系统实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:wuyoucao654321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着Internet的快速普及,人们生活方式和认知世界的途径发生了翻天覆地的变化。由于互联网规模和覆盖面的迅速增长,人们主动或被动获取的信息也越来越多,同时,人们想从互联网上快速获取自己感兴趣的信息也变得越来越困难。面对这样的挑战,各种信息过滤和筛选技术应运而生,本世纪初由研究人员提出的协同过滤推荐系统作为一种个性化的信息过滤手段,逐渐受到人们的重视并在各个领域被广泛应用。   本文的研究是基于一个视频展示和搜索平台,尝试为视频平台的用户提供高效的、个性化的推荐算法。   首先,本文对应用最为广泛的协同过滤推荐算法进行了充分的调研,并比较基于内存的协同过滤算法和基于模型的协同过滤算法的不同及其各自的优缺点。   其次,本文分析了现阶段互联网多媒体信息尤其是视频信息的特点,并对协同过滤技术框架中现有的三种相似性度量方法进行了简单的比较,发现其忽略了用户及项目的背景信息,并在面对高稀疏度数据时效果并不理想。针对这样的问题,考虑到多媒体信息的特点,本文提出了一种基于用户或项目分类信息的,多级概化的相似性度量方法框架,并通过在Movielens数据集上的实验,证明了该算法在面对高稀疏度的数据时,能够通过多级信息概化,有效的提高协同过滤算法的效果。   第三,针对推荐系统结果的巴尔干化效应,以及传统KNN算法在近邻集选择上的弊端,本文设计了一个自适应的近邻集选择框架,并通过对基于用户和基于项目的协同过滤算法预测结果进行自适应的加权平均,较为有效的提高了算法的预测结果。   最后,针对视频信息的特点,以及用户在视频分享网站上的行为特征,本文提出了一个以用户停留时间这一隐式评价信息为基准的矩阵填充方法。并在此基础上,搭建了以改进的协同过滤技术为核心的基于《世纪大讲堂》视频信息的推荐平台。
其他文献
本文主要讨论用贝叶斯随机搜索方法进行模型选择及参数估计。借助拉丁变量计算的贝叶斯随机搜索模型,把模型选择问题转化为对拉丁变量后验分布的分析。在通过积分等手段,使得
细分方法是曲面造型技术的重要工具之一,被广泛应用于计算机辅助几何设计与计算机图形学等领域。传统的逼近型与插值型细分方法在曲面的层次细节表达上有许多缺陷,尤其是在对
顶空液相微萃取(HS-LPME)技术是一种集分离、纯化、浓缩为一体的样品前处理方法,该技术已经广泛应用于对多种不同样品中挥发性或半挥发性目标物的富集。在该技术中,提高样品
随着面向服务的软件体系结构、软件即服务、云计算等新的软件架构思想和运营理念的发展,Web服务作为互联网中最为重要的计算资源和软件资产,以其语言独立、平台无关、协议标
近年来,随着处理器技术和性能的快速发展,尤其是硬件虚拟化技术的诞生,虚拟化技术成为当前研究的热点。虚拟化技术可以提高硬件的利用率,降低应用成本,减少配置和管理的复杂性,同时
应用程序间虚拟隔离是构建可信应用环境的重要途径之一。由于应用程序的来源不同,系统对其的信任程度也不相同,而在同一个系统中运行的应用程序在运行中可能会调用信任度不同
如今,各种移动设备已广泛地应用于人们生活,其中手机更是成为日常生活不可缺少的工具。因此,移动设备的可用性问题也引起了研究者的日益关注。传统方式的可用性测试需要在配置了
多任务联盟问题(Multi-Task Coalition Problem,MTCP)是一个复杂的组合优化问题,由于其求解模型可在分布式监控网络、突发灾难救援和电子商务等领域中得到广泛应用,所以一直
随着互联网技术的发展,电子商务、网络银行等网络交易活动也蓬勃发展;但随着网络交易活动的增加,使得这些活动在信息安全领域面临重大挑战。尤其是重要信息的传递和控制非常困
Web服务是一种分布式技术,是基于Web技术的最新成果,被称之为IT技术的第三次革命。Web服务是自包含、自描述及模块化的应用程序,其通过标准的Web协议使得不同平台的应用服务