浅谈个性化推荐系统的算法

来源 :科技尚品 | 被引量 : 0次 | 上传用户:zhaox8712
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:个性化推荐在中国的高速发展,大家有目共睹。虽然许多推荐结果可能不尽如人意,还达不到很多人期待的结果。但个性化推荐相信每一个人都是有他独特的价值。尊重每一个活生生的个体,而不是二八法则中那冷冰冰的数字。
  关键词:个性化推荐;协同过滤
  1 个性化推荐系统的兴起
  1.1 商业动力
  在传统的营销策略当中,商家主要关注在20%的商品上创造80%收益的客户群,往往会忽略了那些在80%的商品上创造20%收益的客户群。这就是典型的二八法则的应用,而长尾理论的提出,直接打破了传统的二八法则,这是网络时代兴起的一种新理论,最初由美国《连线》杂志(Wired)总编辑克里斯·安德森于04年首先发表。由于成本和效率的因素,当商品储存流通展示的场地和渠道足够宽广,商品生产成本急剧下降以至于个人都可以进行生产,并且商品的销售成本急剧降低时,几乎任何以前看似需求极低的产品,只要有卖,都会有人买。
  1.2 web2.0时代的用户需求
  对用户而言——如何快速获取自己想要的信息是互联网用户的主要需求之一,在用户对自己需求相对明确的时候,用搜索引擎能很方便的通过关键字搜索找到自己需要的信息。但在很多情况下,用户其实并不明确自己的需要,或者他们的需求很难用简单的关键字来表述。又或者他们需要更加符合他们个人口味和喜好的结果,因此出现了推荐系统。
  1.3 技术条件
  推荐系统应该是目前互联网世界最常见的一种智能产品形式。它的技术基础直接源于一系列的人工智能学科的成果。虽然五十多年来,人工智能学科并没能实现人工智能的目标,但一系列成果仍然是值得称道的。举个简单的例子,其中一个分支从规则方法的思路上摆脱出来,寻求利用群体智能,其中一个方向是基于统计规律的思路,而推荐系统中最古老的一个算法:协同过滤算法,正好是这么个思路下的产物。
  协同过滤算法是推荐系统中应用最为广泛的基础性算法。基于用户的协同过滤算法推荐更社会化,基于物品的协同过滤算法则更加个性化,能提供更好的推荐解释。
  2 个性化推荐系统的算法
  2.1 实现原理
  随着推荐引擎的出现,用户获取信息的方式从简单的目标明确的数据的搜索转换到更高级更符合人们使用习惯的信息发现。目前大部分电子商务和社交网站的推荐引擎的工作原理还是基于物品或者用户的相似集进行推荐。在海量物品和用户的系统中,推荐引擎的计算量是相当大的,要实现实时的推荐务必需要建立一个推荐模型。主流模型是基于协同过滤的推荐机制。它的原理就是根据用户对物品或者信息的偏好,发现物品或者内容本身的相关性,或者是发现用户的相关性,然后再基于这些关联性进行推荐。基于协同过滤的推荐可以分为3个子类:基于用户的推荐,基于项目的推荐和基于模型的推荐。基于用户的协同过滤推荐的基本原理是,根据所有用户对物品或者信息的偏好,发现与当前用户口味和偏好相似的“邻居”用户群,在一般的应用中是采用计算“K-邻居”的算法;然后,基于这K个邻居的历史偏好信息,为当前用户进行推荐。
  2.2 协同过滤
  2.2.1 基于用户的协同过滤
  协同过滤是一种个性化的推荐算法,这种推荐算法在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的,基于内容分析过滤的推荐不同,协同过滤分析的是用户之间的区别与联系。举个例子:
  基于内容分析的推荐:
  甲喜欢歌曲A、B、C,通过分析得知A、B、C都是轻快的轻音乐,那么系统将推荐具有类似特征的轻音乐D给甲。
  基于协同过滤的推荐:
  甲喜欢歌曲A、B、C,乙喜欢歌曲A、B、C、D,那么甲和乙就有很大的相似性,系统将把乙喜欢的歌曲D推荐给甲。
  总的来说,协同过滤分析大量用户的兴趣,在用户群中找到与用户甲有相似(兴趣)的用户乙、丙、丁等,综合相似用户乙、丙、丁等对某一内容进行评价,预测甲对该内容的喜爱程度,从而决定是否进行推荐。
  2.2.2 基于物品的协同过滤
  基于项目的协同过滤推荐的基本原理也是类似的,只是说它使用所有用户对物品或者信息的偏好,发现物品和物品之间的相似度,然后根据用户的历史偏好信息,将类似的物品推荐给用户。
  假设用户甲喜欢物品A和物品C,用户乙喜欢物品A,物品B和物品C,用户丙喜欢物品A。从这些用户的历史喜好可以分析出物品A和物品C是比較类似的,因为喜欢物品A的人都喜欢物品C,基于这个数据可以推断用户丙很有可能也喜欢物品C,所以系统会将物品C推荐给用户C。
  与上面讲的类似,基于物品的协同过滤推荐和基于用户的推荐其实都是基于相似度预测推荐,只是相似度计算的方法不一样。在大部分站点中,物品的个数是远远小于用户的数量的,而且物品的个数和相似度相对比较稳定,同时基于项目的机制比基于用户的实时性更好一些。
  现行主流的推荐往往是将多个方法混合在一起,从而达到更好的推荐效果。包括组合加权的混合、切换的混合、分区的混合、分层的混合等等。
  2.3 协同过滤的优点
  (1)能够过滤机器难以自动分析的信息
  在大量信息的推荐中,依靠专门的人力对信息进行识别分类的成本太大,大多是依靠机器进行自动识别。对于文本信息来说,可以进行关键字的比对,因此机器识别是很有效的,但对于艺术品、音乐这些信息来说,机器识别就十分困难。协同过滤的方法可以将大量的用户调动起来,几乎零成本地运用了人力识别的方法。
  (2)能够基于复杂概念进行过滤
  同样,机器只能简单判断类别,但很难判断情感、品味。例如在云音乐上,我们经常看到用户编辑的“100首最伤感歌曲”推荐,依靠机器则难以判断歌曲情绪形成推荐。
  (3)能够保证推荐的新颖性
  一旦平台聚集了大量的用户,用户便时时刻刻在生产出新的信息,新的内容,保证了推荐内容的新颖性。
  参考文献
  [1]项亮.推荐系统实践[M].人民邮电出版社,2012.
  [2]吴军.数字之美[M].人民邮电出版社,2013.
  [2](奥地利)詹尼士.推荐系统[M].人民邮电出版社,2013.
  (作者单位:山东省新泰市第一中学)
其他文献
2008年5月12日14时28分,四川省汶川县发生了震惊世界的里氏8.0级特大地震,造成严重的人员伤亡和巨大的财产损失。从那一刻起,“我们都是汶川人”的呼喊撼动了神州大地;从那一刻起,“有爱就有希望”的口号也在深圳安鑫宝公司全体员工的心中唱响。    面对无家可归的同胞、面对民政部门统计的不断攀升的伤亡数字、面对受灾现场的残垣断壁,每个人的心中都会涌起无限的哀思和捶叹……  安鑫宝董事长唐国林于灾
Flat supercontinuum in the telecommunication wave bands of E+S+C is generated by coupling a train of femtosecond pulses generated by a mode-locked Ti:sapphire l
期刊
摘 要:应答器传输系统是一种点式信息传输设备,可用于城市轨道交通及大铁路各级列车运行控制系统。它由车载设备和地面设备两大部分组成。本文主要介绍一种应答器的模拟系统的实现。  关键词:应答器;系统;模拟  1 系统简介  应答器系统由车载设备和地面设备两大部分组成。地面设备包含:地面电子单元(以下简称LEU)和欧标应答器(以下简称应答器,其中包含无源应答器和有源应答器);车载设备为应答器传输模块(以
We study the possibility of using a spin chain to construct a quantum entanglement channel that can be used for quantum state transmission in a solid state syst
期刊
摘 要:为了提高天然气(主要成分为甲烷)储运的安全性和经济性,本文提出了一种扫描式可视化气体微泄露实时探测系统,利用PLC通过RS485接口对防爆云台进行远程自动控制、同时将采集到的气体浓度等信息,经过PLC处理后利用组态软件及其视频系统扫描方式远程查看气体数据信息,对站场、阀室、储气库等生产操作区域的甲烷气体浓度进行不间断、高精度、自动化、可视化、远距离监控,从而提升天然气储运的整体安全水平。 
摘 要:BIM(建筑信息模型,是Building Information Modeling的缩写)是以建筑项目的各项工程信息(数据)为基础,建立建筑模型,通过数字信息仿真来模拟建筑物所具有的各种真实信息的一种新的设计技术。本文通过使用BIM软件工具Revit开展真实的工业建筑结构设计过程,探讨了具体的基于BIM的结构设计方法。  关键词:BIM;工业建筑;结构设计;Revit  1 概述  工业建
We present theoretical predictions including the complete next-to-leading order (NLO) QCD corrections to the top quark pair production in association with a pho
期刊
摘 要:近年来,大数据技术被广泛应用于各行各业,并发挥了巨大潜能优势,通信领域也不例外。随着通信业务的不断丰富拓展,传统数据技术已经无法充分满足现实发展要求,甚至在某种程度上制约了通信运营商的发展。对此,本文结合当前通信运营现状,在简要概述大数据应用背景的基础上,重点分析了大数据在通信领域的应用现状及前景,以期为广大业内同仁提供有益思考。  关键词:大数据;通信行业;应用现状  社会新常态下,“通
10年来,我国在证券市场国际化方面迈出了可喜的步伐。当前经济全球化条件下,资本市场不仅加快了与国际接轨的进程,而且在按照国际惯例指导运作方面的速度也在不断提高。那么,
期刊