基于Web使用挖掘的个性化推荐服务研究

来源 :河海大学 | 被引量 : 2次 | 上传用户:jimchenstong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet应用的迅速发展,网上信息迅速增长,信息种类也越来越多,人们面对太多的信息无法选择和消化,此种现象称为信息过载。Internet上信息资源分布的广泛性又给用户寻找感兴趣的信息增加了困难,也就是所谓的信息迷失。当前主要采用搜索引擎来检索Web上的信息,大多数搜索引擎缺乏主动性,未考虑个体用户的兴趣偏好,因而未能有效地解决信息过载和信息迷失的问题。为了有效地解决信息过载和信息迷失给人们带来的种种困扰。最近研究者们提出了一种被认为能有效解决这些问题的技术--Web个性化服务技术。 基于Web使用挖掘的个性化服务是目前Web个性化服务中应用和研究的关键技术,Web使用挖掘主要应用于个性化推荐服务,商业智能和Web站点优化。本文主要对基于Web使用挖掘的个性化推荐服务中若干关键技术进行了研究。 本文的主要研究内容如下: 1.Web使用挖掘的方法研究。详细的研究和探讨了Web使用挖掘的整个过程(如:数据收集、数据预处理、模式发现、模式分析以及应用)。 2.提出了一种可扩展兴趣表示模型(SIM)。首先,介绍了目前个性化推荐服务系统中表示用户浏览兴趣和CI(cluster’s interest characteristic,后文将用“CI”代替“聚类的兴趣特征”)的若干方法,分析了它们各自的不足之处。然后,提出了一种可扩展兴趣表示模型(SIM)。SIM利用用户会话(后文将用“会话”代替“用户会话”)的所有2-会话片断的特征来表示SI(session’s interest characteristic,后文将用“SI”代替“用户会话的兴趣特征”)。SIM是一个可扩展模型,根据具体应用的需要SIM可以调整从2-会话片断中抽取特征的数目来调整它表示SI和CI的准确性。实验结果表明,SIM有效提高了表示SI和CI的准确性。 3.提出了一种基于会话聚类的个性化推荐算法(SCRec)。首先,详细分析了目前基于聚类挖掘技术的个性化推荐方法的若干不足之处。然后,提出了一种基于会话聚类的个性化推荐算法(SCRec)。数据预处理阶段和会话聚类阶段,SCRec利用SIM表示SI和CI,推荐产生阶段,SCRec利用2-会话片断在聚类中的权重和当前会话与聚类的相似性来产生推荐。实验结果表明,基于会话聚类的个性化推荐算法(SCRec)可以有效提高推荐系统的服务质量。
其他文献
谱聚类算法能对任意形状的样本空间聚类出较好的结果,近年来在数据挖掘、机器学习等领域得到了广泛关注。选择性集成能降低存储需求,提高预测速度,改善集成学习机的预测效果,由此
近年来,随着计算机技术的不断发展,不仅Web教育资源的存储量呈指数级增长,而且其受污染程度也日益加剧。如何从海量的资源中发现用户所需要的Web教育资源成为当前教育界的一
随着民航运输市场竞争越来越激烈,如何合理、有效地制定航班计划就成为航空公司对未来发展进行决策的重要内容。航段运量预测是制定航班计划的重要步骤,其预测结果是制定航班
支持向量机是基于统计学习理论和结构风险最小化的数据挖掘技术,具有非线性、推广能力强以及全局最优等特点,具有诸多优势。但目前依然存在许多问题尚未得到解决。本文对支持向
嵌入式软件的应用与开发是当今计算机软件发展领域的一个热点,保证嵌入式软件的质量是非常重要的。嵌入式软件的可测试性作为一个软件度量指标,是指软件在任意给定输入集合下
在网络技术迅猛发展的时代,网络应用、电子商务的发展使我们越来越多地依赖智能卡、身份证、密码、数字证书等安全措施进行身份识别和安全认证。但各种措施都或多或少地伴随
人工神经网络(Artificial Neutral Networks,缩写为 ANN)作为一种人工智能的研究方法,目前已广泛应用于自然科学的各个领域。白酒勾兑是我国酿酒行业生产中的一项重要传统工
随着Internet的飞速发展,庞大的Web资源日益演变为人们获得知识与信息的来源。与此同时,由于Web资源的迅速膨胀以及Web信息的分散性与异构性,用户很难通过易用的方式快速准确
SOAP(Simple Object Access Protocol)作为Web服务通信协议的基础,在实现Web服务安全性的工程中扮演着极其重要的角色。SOAP的设计思想是通过现有的标准和协议来建立一个简单
随着“数字地球”概念的提出和发展,作为其重要组成部分的三维地理信息系统也得到了长足的发展。三维地理信息系统的研究领域涉及计算机图形学、虚拟现实、空间数据库等技术