基于用户兴趣模型的web推荐系统的研究与实现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:jorlin2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet现在已经成为获取信息的重要源泉。但随着Internet上的信息呈指数级别的增长,用户逐渐被淹没在信息的海洋中,全面,及时的获取感兴趣的新闻和信息已经变得越来越难。如何以用户为中心,为其提供量身定制的web推荐服务已成为当前学术界和产业界的研究热点。 本论文主要研究如何根据用户的web浏览历史内容来学习用户的浏览兴趣和偏好,并将用户的兴趣与偏好形式化成为用户兴趣模型,最后基于用户兴趣模型向用户作web推荐。 系统使用加权向量((interest1,weight1),…(interesti,weighti),…)来表示用户兴趣模型。其中interesti表示用户的第i个兴趣点,而weighti则表示了该兴趣点在用户兴趣组成中所占的比率。系统充分考虑了用户兴趣模型在两个方面的功能需求:一方面,为了很好的指导web推荐,用户兴趣模型必须具备良好的准确性和描述完备性;另一方面,对于终端观察分析者,用户兴趣模型必须具备清晰,简洁的展示效果。基于以上两点考虑,本文提出了同时提供两套用户兴趣模型的策略,首先采用层次聚类方法得到一套用户兴趣模型,该模型用聚类后所得类簇的特征向量描述用户的一个兴趣点。实验结果表明,该套模型在相似度阈值取0.2时,对于实验数据集的聚类准确率为99.5%,且由于用户兴趣是自描述的,所以描述完备。用这套模型指导web推荐,用户反映推荐的webs符合其兴趣;接着,对聚类所得类簇的特征向量进行朴素Bayes分类,得到了第二套用户兴趣模型,该模型用分类后所得类别信息来描述用户的一个兴趣点,因此表达清晰,简洁。并且,实验结果表明,对聚类后的类簇进行朴素Bayes分类比直接对文本进行朴素Bayes分类取得了更高的分类准确率。 本论文还提出了URL模式的概念,并给出了根据聚类学习后得到的一个类簇中的URL集的URL模式统计信息进行宽度优先搜索来获取该类簇的候选URL集的解决方案。实验结果表明,通过该方法获得的候选URL集不仅取自于用户所偏好的媒体,而且在web的主题相关度和时效性方面也表现良好。通过获取候选URL集,缩小了在web推荐过程中需要过滤的webs的范围,从而加快了系统的执行效率。
其他文献
图是计算机科学最常用的一类抽象数据结构,在结构和语义方面比线性表和树更加复杂,更具有一般性表示能力。现实世界中许多应用场景都需要用图结构表示,与图相关的处理和应用
随着IT技术的持续发展,计算机游戏在整个IT技术领域扮演的角色越来越重要,而游戏引擎则成为了计算机游戏领域中的核心技术。然而大多数关于游戏引擎的研究都集中在视频和人工
粒子群算法(简称PSO)是由Kennedy和Eberhart于1995年提出的一类随机群集智能优化算法。Kennedy和Eberhart对鸟群的觅食行为进行研究发现,单只鸟的能力是非常有限的,但是它们
随着计算机和网络技术的快速发展,用户之间的协同工作进入了通过互联网进行协同工作的时代,协同技术被应用于各个场景,时时刻刻影响着人们的生活。协同技术的实现大多是基于