基于XML及关联规则的个性化推荐技术研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:hellolin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet应用的迅速发展,信息过载使人们面对太多的信息而难以选择和消化,信息资源分布的广泛性又给用户寻找感兴趣的信息增加了困难,使人们易于信息迷失。迫切需要一种新的技术使人们在海量数据中查找想要的数据和有用信息时能自动地发现、抽取和过滤信息。个性化推荐技术的出现,使得人们从无限的网络信息资源和繁杂的商品世界中解脱出来,大大节省了用户在信息搜索上花费的时间和精力,也使得Web网站从以“网页”为中心转换为以“用户”为中心,给用户提供个性化服务,向着网络服务的更高层次发展。由于已有的个性化推荐技术在收集匿名用户信息、推荐实时性和准确性等方面存在不足,本文在研究经典的关联规则挖掘算法基础上,提出基于XML及关联规则的Web挖掘技术来分析和挖掘Web用户访问日志,得到用户对Web网站的频繁访问模式,采用基于关联规则的个性化推荐技术以提高Web站点访问效率。论文主要工作包括:①对个性化推荐技术的研究背景、研究现状、实际应用意义以及Web使用挖掘的理论基础进行了阐述和分析,并对关联规则挖掘的基本原理进行了说明。②本文运用由XML技术衍生出来的XGMML和LOGML实现Web访问日志的表示和存储,采用数据清理、用户识别、会话识别、路径补充和事务识别等步骤完成Web日志挖掘中的数据预处理。③在分析了Apriori算法和FP-growth算法后提出了利用MFIT对FP-growth算法进行改进。改进的FP-growth算法降低了挖掘最大频繁项目集的搜索空间,以及减少了超集检测所做的项目匹配次数,从而提高了算法的执行效率。④设计和实现了一个个性化推荐原型系统,在利用用户频繁访问模式进行页面推荐的过程中引入页面的距离因子的计算来提高推荐质量。本文的研究工作是对挖掘关联规则的FP-growth算法的切实可行的改进,对研究关联规则的挖掘算法具有一定的参考价值;对用户访问模式的研究有利于提高站点信息服务质量,促进智能信息处理领域的发展,在理论和实践上都有重要的研究意义。
其他文献
Web服务和语义Web是WWW发展的两个重要趋势,两者具有很好的互补性,这两种技术的结合产生了另一个新兴的研究课题——语义Web服务。语义Web服务指的是用语义Web标记语言来描述
Web已经成为人类获取信息和得到服务主要方式之一,Internet技术的高速发展使它成为了一个庞大的知识库,但同时也带来了许多问题。首先,Web规模的膨胀使得整个Web上的有用信息
随着因特网信息量的爆炸式增长,搜索引擎已经是有效获取信息的一种必要手段。为了满足专门学科领域和特定主题的搜索用户要求,主题搜索引擎在数据挖掘及信息检索领域变得越来
本文结合东莞电信实业管理系统的开发,提出了基于SOA (Service-Oriented Architecture)的连锁业务系统的解决方案,分析了该方案的原理和优势,并采用WCF (Windows Communicati
流体仿真以及大规模的人群行为模拟一直是计算机图形学的难点与重点,经过研究者的大量的数据分析与钻研,提出了各种各样的理论与算法。本文将流体仿真以及大规模人群行为模拟
生物信息学是一门新兴的交叉学科,它需要生物学、计算机科学以及数学三门学科的高级研究人员通力合作来完成。生物信息学以计算机、网络为工具,用数学和信息科学的理论、方法和
当今社会,随着信息技术的不断发展,企业为了适应彼此间日趋频繁的业务活动和提高自身竞争力,投入大量资源研发针对各部门需求的业务系统。然而这些业务系统功能各异,彼此之间
全球互联网技术、网络通信技术、计算机技术的高速发展,全球网络信息化系统已经成为现在各行各业持续发展的基础设施,网络信息系统对整个社会发展做出了巨大的贡献。由于数据
无线传感器网络(WSNs)综合了现代网络无线通信技术、嵌入式计算技术、分布式信息处理技术、传感器技术等先进技术,具有十分广阔的应用前景,是目前网络通信领域的新研究热点之
现实生活中的很多问题都是多目标优化问题,越来越多的专家和学者使用演化算法来解决多目标优化问题,并且取得了比较好的结果。在演化过程中,如果演化选择方法使用不当,很难使