基于混合算法的Maze资源推荐系统的设计与合成

来源 :北京大学 | 被引量 : 0次 | 上传用户:moxiaomi521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,推荐系统在各种资源社区以及电子商务网站得以应用,其中最主流的推荐方法便是协同过滤。但迄今为止,没有任何方法能很好的适应任何的数据集合。针对特定的数据集,人们往往根据已有的方法设计出不同的版本或者混合各种已有的方法来作为推荐引擎的核心。本文针对Maze资源和用户行为的特点,设计出一个基于混合方法的资源推荐系统,以解决在缺乏用户-资源评分体系与资源描述信息情况下的资源推荐问题。   本文首先针对推荐系统中常见的冷启动问题,利用文本聚类方法做出初步推荐。其中主要涉及到短文本资源聚类中的相似性评价问题,以及聚类的等价性和效率问题。对于相似性评价问题,首先利用词的全局和局部统计概率模型去描述每一个资源,然后利用调整离散余弦夹角公式去计算资源名称的相似度。为解决增量聚类的的等价性和效率问题,我们采用类词索引的方法,并使用一种新的“聚类”概念用以支持类的分裂和资源的多重类属性。   为了弥补聚类推荐的不足,提高推荐的准确度和丰富度,本文提出了根据用户资源下载关系有向图来预测用户可能感兴趣的资源的方法。此方法继承了协同过滤的思想,但有别于通用的协同过滤方法,可以利用文件下载的先后顺序发现文件之间存在的潜在层次关系,从而减少无意思的推荐,增加有意义的推荐。提高用户对于所推荐资源的惊喜度。   最后,针对系统数据集的丰富程度,以及考虑用户兴趣模型,本文论述了如何把几种推荐方式相结合的方法。
其他文献
随着全球经济技术的发展和Internet的普及,企业的通信需求已经趋向多元化。传统PBX(用户级交换机)己经难以适应现代企业的发展模式和增长需要,而IP-PBX符合下一代网络融合的
人类基因组工作草图绘制完成后,生命科学已进入后基因组时代,结构生物学正处在具有战略性的关键地位,研究蛋白质的结构与功能,特别是蛋白质的三维结构,是揭示基因组功能的基本途径
虚拟技术的发展带给IT安全领域很大的机遇和挑战,在虚拟化架构下对虚拟机进行监控成为十分必要的安全管理方式。本文在此背景下提出利用Xen虚拟化技术对虚拟机内运行的进程进
随着互联网上信息资源的日益增多,用户对个性化服务的要求不断提高。协同过滤推荐技术是个性化服务发展中最成功且应用最广泛的推荐技术之一,然而,出于隐私考虑,许多用户不愿
受到免疫原理的启发,本文提出了三种基于人工免疫原理的病毒检测算法,目的是构建一个轻量级的、具有较快检测速度、较高检测率而且有一定泛化能力的病毒检测系统。   基于
三维模型处理技术广泛应用于计算机辅助设计、虚拟现实等众多领域。随着计算机软硬件技术的高速发展以及精密测量技术的出现,三维模型处理技术得到了快速地发展,同时也面临着新
图像有广泛的应用,基于内容的图像检索(Content Based Image Retrieval,CBIR)是数据库、多媒体技术的研究方向之一,近年来已成为国内外研究热点,并将成为21世纪必须攻克的关键技
传统的视频监控系统有许多缺点,例如大部分只能在监视器上提供一幅监控场景的画面,有的即使能够把多路视频显示在一个监视器上,也不能为用户在一幅画面上无冗余地提供被监控
学位
随着信息技术的飞速发展,视频信息逐渐成为我们生活中必不可少的一部分。视频编码技术可以实现视频压缩,大大降低视频信息的数据量。因此,视频编码技术已经成为多媒体产业的核心
随着敏捷开发、终端用户编程等的流行。软件开发人员的个人能力受到了软件工程研究的重视。作为提升软件开发人员能力的重要途径之一,编程过程的复用利用已有方案解决新的编程
学位