基于两阶段联合哈希技术的协同过滤推荐算法研究

来源 :安徽工业大学 | 被引量 : 1次 | 上传用户:koptity
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网时代,互联网技术以及电子商务的高速发展生成了海量信息,对于用户来说,从海量的信息中找到感兴趣的信息正变得越来越难,推荐系统应运而生,它将用户和信息联系了起来,推荐系统为用户找到感兴趣的项目(服务),且可能为用户找到喜欢的新事物。然而,传统推荐系统的协同过滤算法依赖于用户或项目的相似度计算,随着系统中的数据量的极速增加,这种线性的相似度计算方法表现出了局限性。本文提出了一种两阶段联合哈希的协同过滤算法,通过在保留用户对项目的偏好的情况下,将用户和项目映射到低维空间,使得推荐的过程转化为在低维空间搜索与目标用户具有较小海明距离的项目,省去了用户或项目之间的相似度计算,仿真实验表明,本算法具有较高效的推荐性能。本文的主要工作有:第一,提出了在评分数据的其中一个视角(用户或项目)来对该视角进行哈希的方法,在用户或项目视角应用主成分分析技术,得到该视角的低维特征表示,再对其应用迭代量化技术进而生成该视角的二值码,从而实现了对评分数据全局特征的提取。同时,也为进一步生成另一视角的二值码奠定了基础。第二,基于上一过程中得到的其中一个视角的二值码,用已有的评分信息约束用户与项目在海明空间的距离,生成另一视角的二值码,进而实现对评分数据局部特征的提取,也为下一步利用训练生成的用户和项目的二值码进行高效的推荐做好了准备。第三,在两阶段联合哈希的基础上,利用二值码的特性和相似性检索的方法,通过以上两个过程的哈希编码工作,有效的减少了推荐过程中的计算消耗和存储消耗,最终提出并实现了一种基于两阶段联合哈希的协同过滤推荐算法。通过在MovieLens-1M数据集上的仿真实验结果表明,本文提出的算法能有效提高推荐质量和推荐的效率。
其他文献
美国就"中国影响出版物和视听娱乐产品的贸易权和分销服务措施"提出与中国WTO争端解决。本文对专家组裁定及上诉机构裁决做了归纳。最后就本案的核心问题(如对中国入世服务贸易
摘要:随着互联网的日益普及,Internet已经成为给人们工作、学习、生活带来极大方便的信息资源海洋。但由于Internet是一个开放的,无控制机构的网络,经常会受到计算机病毒、黑客的侵袭。它可使计算机和计算机网络数据和文件丢失,系统瘫痪。因此,计算机网络系统安全问题必须放在首位。本文介绍了计算机系统安全的内容及其维护措施。  关键词:计算机网络;系统安全;维护;管理  中图分类号:T330 文献
现阶段我国科技快速发展,各种媒介之间也进行了相互融合,导致观众对电视新闻栏目要求越来越高。因此电视栏目应用媒介融合具有重要意义,虽然电视新闻栏目较多,为能够更好地满
摘要:随着进销存管理系统的规模不断扩大,系统的权限管理也变得日益复杂起来。基于角色和用户组的权限管理模型,把用户所拥有的权限分为不同部门用户的访问权限和同部门内用户的操作权限两部分,即用户的权限等于基于用户组地访问资源权限加上基于角色地功能权限。从而解决了进销存系统中权限管理的复杂性和安全性问题,满足了企业对进销存管理系统的权限要求,使系统具有了更高的灵活性。  关键词:进销存;权限;用户组;角色
摘要:如今政府机关办公已离不开计算机网络,但由于黑客、恶意软件的存在,给机关计算机网络安全带来了很大的威胁。文章主要针对目前计算机网络面临的主要安全威胁,结合机关网络特点,在技术层和管理层上提出一些防范对策。  关键词:政府机关;计算机网络;网络安全;防范对策  中图分类号:TP393 文献标识码:A 文章编号:1007-9599 (2012) 22-0000-02  信息技术的发展,特别是网络技
模块化多电平换流器型高压直流(modular multilevel converter based high voltage direct current,MMC-HVDC)输电作为新一代直流输电技术,凭借有功功率和无功功率解耦可控、
通过有限元分析的方法,阐述了固定球阀球体的应力分布及变形情况,并对几个重要的设计参数作了进一步的灵敏度分析,提出了设计高磅级球体时应注意的问题。