基于WEB日志的个性化推荐系统研究

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:tjpu0510420215
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及和电子商务的发展,电子商务系统结构变得越来越复杂,用户经常会迷失在大量的商品信息空间中。电子商务推荐系统能够直接与用户交互,向访问网站的顾客提供商品信息和建议,并模拟销售人员帮助顾客完成购买过程。推荐算法处于整个推荐系统的核心位置,采用哪种推荐算法对推荐系统的效果和效率至关重要。现在最成功的是协同过滤算法,它分析并利用与当前用户行为相近的一组用户的偏好,向当前用户作有针对性的推荐。针对电子商务推荐系统面临的主要问题,本文对电子商务推荐系统中推荐算法设计以及体系结构等关键技术进行了比较深入的探索和研究。   从Web日志中提取用户、项、访问时间、访问次数等信息来获取用户兴趣度打分值,可以有效的缓解通过网站的注册用户和这些注册用户对商品的评价来获取所产生的数据稀疏性问题,所以Web日志数据的质量就显得非常重要。在Web日志数据预处理的过程中,针对Web同志挖掘中的会话识别问题,本文分别对“Timeout方法”,“参引长度法”进行改进,提出了一种改进的会话识别方法。该方法运用网站的拓扑结构信息,动态设定各页面的时间间隔阈值,使页面时间间隔阈值同页面的重要程度结合起来:同时通过灵活界定内容页,并针对内容页,提出了一些启发式规则,突破了“参引长度法”所固有的一个会话中只包含一个内容页的瓶颈,有效的提高了会话数据的准确度。这些高质量的会话数据将成为个性化推荐系统建立模型的基础数据。   利用用户、项、兴趣度打分值等信息可以构建“用户-项矩阵”二维模型。以往经典协同过滤推荐算法的核心部分(即计算用户或项的相似性),都是基于该模型而设计的。针对大多数商品的销售都具有季节性的特点,本文在“用户-项矩阵”模型基础上,引入用户购买商品的日期因素,构建了“用户-项立方体”三维模型,并基于该模型,提出了一种改进的协同过滤推荐算法。该算法对日期因素赋予了相应的权重,并应用到用户相似性或项相似性的计算中,显著地提高了协同过滤推荐的准确度。改进的协同过滤推荐算法将整个推荐过程分为三大部分:用户聚类、项聚类、最近邻查询及推荐。前两部分离线执行,生成相应的虚拟用户和虚拟项,二者的数据量远远小于原始用户数及项数,在最近邻查询及推荐部分在线执行时,以虚拟用户及虚拟项作为新的搜索空间,其时空复杂度大大降低,很好的满足了推荐系统的实时性要求。
其他文献
随着XML技术的发展和普遍应用,XML已成为数据交换的标准,如何高效的实现XML的存储和更新成为非常重要的研究方向。本文的主要研究内容包括3个方面①XML文档的关系化存储方法;②
化学表达式在化学教育教学和科学研究领域占有举足轻重的地位,化学表达式的编辑也逐渐成为研究的热点。虽然目前已有相当数量的化学表达式编辑和分子结构绘制软件,但该类软件大
大规模语料库的出现和计算机处理能力的提高,使得数据驱动的方法在某些自然语言处理的子领域里,如中文分词,词性标注,语言建模等取得了巨大的成功。但在语言建模,机器翻译等领域,随
随着科学技术的发展以及机器人应用领域的扩大,人们对机器人技术提出了更高的要求,希望机器人具有更高的智能和更强的环境适应能力,机器人视觉伺服研究正是为了满足这一要求而展
随着计算机和网络技术发展,企业内部的管理模式也发生了重要改变。社会逐步由个人工作时代迈入了协同工作时代。而群件正是适应这种工作模式变革而产生和发展的。群件很大程度
随着互联网技术的飞速发展,网络正在成为人们进行信息交流和信息处理的有效平台,网上信息迅速增长,信息的种类也越来越多,人们面对太多的信息无法选择和消化,此种现象称为信息过载
随着互联网服务的发展,作为网络交互双方建立信任基础的用户身份信息正在越来越频繁的使用。于此同时,对包含在身份信息内涉及到隐私和机密的部分进行有效保护成为网络用户关心
为了解决在自然条件下地下管网容易受腐蚀的问题,采用基于腐蚀电化学原理的防腐层缺陷检测技术和控制技术并应用于阴极保护装置中,通过对被保护金属管道施加阴极电流,使其阴极电
随着网络技术和计算机图形学的不断发展,3D游戏已经越来越受到广大青少年的喜爱,各式样的游戏层出不穷。然而,目前我国的网络游戏市场却基本上为国外产品所占领,而且国内大部分游
利用计算机来调度任务,已经广泛运用于信息社会中的各个领域,无论是银行机构、医疗保健、科研教育,还是企事业单位、军事管理,计算机都已经成为不可或缺的角色。信息社会的高科技