基于遗传算法的Web行为预测

来源 :长春工业大学 | 被引量 : 0次 | 上传用户:roy1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet的迅速发展,给人们带来丰富信息和极大便利的同时,也随之产生了一些亟待解决的问题,构建智能化的Web站点便是其中之一。直接或间接的解决这个问题的途径之一就是将数据挖掘技术应用于Web。 基于Web的数据挖掘主要分为Web内容挖掘、Web结构挖掘和Web使用挖掘。本文主要对Web使用挖掘进行研究。Web使用挖掘通过对Web服务器的日志文件进行挖掘发现用户的访问模式,也称为Web日志挖掘。Web使用挖掘在改善网络结构、网站性能,提高网站的安全性,为用户提供个性化服务,电子商务等方面起着重要的作用,并具有广阔的发展前景。 Web日志中保存的历史数据反映了用户访问页面的意向,利用日志中的信息可以预测客户将来可能发出的访问请求,预测包括学习和匹配。学习是分析历史行为或其他客户行为,提取客户一般情况下或所属类别的行为模型;匹配是确定正在进行的客户行为模型,根据共同访问模式来推断将来的请求。 本课题研究了WEB日志挖掘系统的基本理论,分析了WEB日志挖掘系统的发展历史、研究现状、研究内容及存在的问题,在此基础上引入智能计算技术——遗传算法作为解决问题的方法。 同时本论文提出了基于多种数据挖掘技术的WEB日志挖掘系统的总体框架设计方案,重点研究了系统中的数据预处理模块与挖掘模块的设计与实现,以及挖掘模块算法库中的自适应遗传算法的设计与实现,并且利用新的Web日志信息实现了增量式的规则维护与更新。 最后根据本论文的设计方案对已有的Web日志数据进行了实验,结果表明可以发现有效的频繁访问模式,以及对已有的访问模式集进行增量式的更新;基于得到的模式集,可以实现Web用户的行为预测,并且预测的准确率和召回率都有一定的改进,有助于Web站点的改进和站点为用户提供个性化、智能化服务。
其他文献
中间件技术以其统一部署和动态管理的特点,正受到越来越多的关注。基于中间件技术的多层分布式系统对于提高软件性能有着重要的实际意义。本文提出了基于中间件技术的多层分布
目前,计算机的应用已普及到人类生活中的各个领域,几乎各行各业的各种活动都可以利用计算机。计算机之所以能够发挥巨大作用,软件的作用必不可少。做为人类商品社会中的一种
供应链管理(Supply Chain Management,SCM)是目前受到国际学术界和企业界普遍重视的一种增强企业竞争力的管理思想和方法。Agent具有自主性、交互性、主动性和反应性,使它比
随着计算机技术的不断发展,人机交互的方式日趋人性化和智能化。然而,目前广泛应用的基于WIMP界面的交互方式限制了交互过程中人的自主性和创造性。在多通道交互中,通过整合不同
P2P技术是目前Internet上发展最快的应用领域,P2P网络是建立在Internet上的覆盖网(Overlay),P2P模式不同于传统的客户机/服务器模式,改变了传统的集中存储和处理资源的方法,P2P将
在过去的十几年间,研究人员对序列模式挖掘进行了深入广泛的研究,并取得了一系列的研究成果。这些研究成果已经被广泛的应用到社会生产生活的各个领域中。序列模式挖掘已经成为
随着计算机网络技术的迅速发展和互联网应用的日益普及,网络已经成为信息社会中不可缺少的一个部分,网络安全问题也显得越来越重要。拒绝服务攻击是一类常见的网络攻击,对网络社
随着入侵检测技术的重要性日益凸显以及Linux操作系统的地位不断提升,对Linux入侵检测系统进行研究具有重要的现实意义。目前Linux下的入侵检测系统主要使用基于规则匹配和数
本文对NHPP类软件可靠性增长模型做了深入研究与探讨,讨论了提高软件可靠性预测和评估精度的方法,设计并实现了一个基于软件可靠性增长模型的软件可靠性评估与预测原型系统.
网络协议实验作为原理验证性实验,在网络与互联网实验内容体系中占有非常重要的地位,应该使网络协议的基础知识和各种协议都能在实验内容体系中得到充分的体现。但是目前各高校