Web上的个性化推荐技术研究与实现

来源 :长春工业大学 | 被引量 : 0次 | 上传用户:guogangw1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的不断发展,Web已成为人们获取信息的一个重要途径。由于信息技术的高速发展,Internet上的信息资源呈指数膨胀,面对海量数据人们不得不花费大量的时间去搜索、浏览自己需要的信息。即使找到了一些,也经常混有很多“噪音”。针对这一问题人们提出了个性化推荐系统,它可以帮助用户在大量的信息中快速寻找到感兴趣的内容,并且将此项技术应用于网站建设中能充分提高站点的服务质量和访问效率,从而吸引更多的访问者。 协同过滤推荐是当前最成功的推荐技术。其基本思想是基于评分相似的最近邻居的评分数据向目标用户产生推荐。由于最近邻居对项目的评分与目标用户非常相似,因此目标用户对未评分项目的评分可以通过最近邻居对该项目评分的加权平均值逼近。它通过构造用户对项目的偏好数据集来实现,并不依赖于对这些商品必须有的文本描述。因此在个性化推荐系统中成为一项很受欢迎的技术。 本文对协同过滤及其在推荐系统中的应用、面临的问题和挑战以及相应的解决方法进行了详细的分析与研究。针对传统CF算法和基于项目评分的CF算法中存在的数据稀疏、扩展性以及计算效率问题,对其相似性计算和推荐集选取方法进行了改进,提出了一种改进的基于相关相似性的CF算法,以期产生更为准确的用户兴趣度预测,从而提高系统推荐的质量与推荐效率。具体内容包括: 1.总结分析协同过滤及其在个性化推荐系统中的应用和实现技术;分析其面临的主要问题和挑战(如:稀疏性问题、扩展性问题等)及现有的解决方法,如将SVD与协同过滤结合、聚类与协同过滤的结合等。 2.在实验的基础上比较基于余弦相似性、基于相关相似性与基于项目评分的CF算法的共同点、不同点以及优缺点。对其相似性计算和推荐集选取方法进行改进,提出了一种改进的基于相关相似性的CF算法。 3.利用一个被广泛使用和认可的实验数据集对改进算法进行实验验证,并对改进算法和原算法进行性能对比与评价。
其他文献
提出了一种新的基于转折指标量体系的混沌时间序列转折点(拐点)预测的理论模型。在该理论模型基础上提出了基于径向基函数(RBF)网络的非线性动力系统建模方法。利用混沌吸引
现场可编程门阵列(Field Programmable Gate Arrays,FPGA)以其可编程、高并行性、高集成度等优点,被广泛应用于通信、控制等领域。  然而,随着FPGA器件日益复杂和设计规模日益
数据挖掘(Data Mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。随着通讯技术的发
随着网络技术和网络应用的发展,Internet的正常运转受到多种威胁。现有的网络安全防护技术和产品不能完全保证网络安全和信息安全。因此,安全审计作为一种事后技术,成为网络安全
随着硬盘成本的降低和容量的增大,用户开始在个人计算机中存放大量文件。虽然大部分操作系统提供了文件搜索工具,但是它们单一、固定的功能难以满足用户对个人计算机中丰富信息
服务组合作为面向服务的计算(Service-Oriented Computing,SOC)和面向服务的体系架构(Service-Oriented Architecture,SOA)中的关键技术,一直以来都是服务计算领域倍受关注的焦
目前,随着互联网络的飞速发展,分布式拒绝服务(DDOS)攻击的危害日益严重,已达到泛滥的程度,DDOS攻击已成为互联网上最具威胁的恶意攻击之一。因此,DDOS攻击的检测和防御是当前安全
随着软件设计结构和代码的复杂化,在软件开发过程中,调试技术越来越重要。调试器,特别是源代码级调试器是目前最方便的调试方式,它可以提供程序源代码、栈、反汇编代码、断点、寄
Web服务具有松散耦合,互操行性强和平台无关等特点,是面向服务体系架构SOA的主要实现方式。基于XML的SOAP协议是Web服务的核心协议之一,它是独立于特定编程语言和平台的可扩展消
本文研究目的是在计算机和手持工具之间或者计算机之间实现数据信息同步时,对数据进行保护。为了验证此目的,运用两台计算机,其中一台配置成SyncML服务器,另一台配置成SyncML客户