基于Web日志的若干挖掘算法及其应用研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:dlfly2011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web日志挖掘是Web挖掘领域中的一个重要应用研究方向。为用户提供一个不仅内容丰富而且方便实用的网站,以更有效地进行网上浏览,这是每个网站所追求的目标。此外,Web站点能否实现个性化,为用户提供个性化的服务,亦已成为衡量站点能否成功的重要因素。通过挖掘Web日志,可以发现用户的访问模式,对优化站点结构和为用户提供个性化服务具有重要的意义。 本文介绍了Web数据挖掘的产生背景,简要地阐述了数据挖掘技术与Web数据挖掘的一般技术、方法和策略,对Web日志数据挖掘过程及其中各环节的关键技术进行了比较深入的探讨。在分析Web日志记录结构及含义的基础上,结合相关课题的研究任务,并以南京信息职业技术学院WWW站点的需求为背景,对Web日志的若干算法及研究进行了研究,并结合挖掘结果给出了优化设计建议,主要工作如下: 1)介绍了Web日志挖掘的相关基本概念,着重研究了Web日志挖掘中的数据预处理过程,将Frame页面过滤技术运用到预处理过程中; 2)对Web日志若干挖掘算法进行了研究,介绍了将数据挖掘领域的关联规则挖掘、序列型式挖掘、聚类等挖掘方法应用于Web日志的具体方法和过程,研究了利用路径遍历模式挖掘方法来发现用户浏览模式的过程; 3)介绍了Web日志挖掘结果的应用,利用挖掘出的规则和模式,对Web站点的结构和站点内页面进行调整的改善,并根据用户的浏览情况,自动生成导航提示。
其他文献
自改革开放以来,随着市场经济体制的建立,我国国民经济发展迅速,但与此同时,职业病危害也日益增多,已成为制约国民经济进一步发展及影响构建和谐社会的因素之一。我国建设项目职业
模糊专家系统是人工智能学科的重要实践领域的前沿,将各种数据挖掘得到的不同形式的知识与模糊专家系统规则库进行有效的融合是模糊专家系统核心研究内容之一。本文主要研究
纹理图像具有图像的基本属性,又具有纹理特性,是一类特殊的图像。纹理具有粒度、方向性和周期性等复杂特性,纹理图像分割是图像工程的重点研究内容之一,也是一个很难解决的问
电容层析成像(ECT)技术是目前较为广泛研究的一种两相流参数检测技术,它具有成本低、速度快、非侵入性、适用范围广和安全性能佳等优点,已在诸多方面得到了研究和应用。但是
数据挖掘通过从海量的数据中发现隐藏的、潜在有用的信息和知识,为人们提供决策支持,在近年来取得了蓬勃的发展。由于越来越多的数据与时间有着密切的联系,时间序列数据挖掘作为
随着我国经济的发展,电力负荷的增长加快,而原有的电网,由于长期投资不足,设备陈旧,技术落后,形成了一些供电瓶颈,因此电网的改造和扩建就成了迫在眉睫的任务。现有的平台系
断层图像重建算法是CT成像系统的重要环节。经过多年的发展,形成了两大类的基本算法,一类是解析重建法,一类是迭代重建法。研究人员已经在这两类算法的发展中取得了很多的突破。
二维矩阵条码是建立在计算机图像处理技术、组合编码原理等理论上的一种图形符号自动识读码制。由于二维条码的信息密度比较高,因此二维条码的有效快速的识别成为当前重要的研
本文针对传统铝电解系统中现有的系统数据共享度、集成度低,且只能进行简单的数据录入、查询、统计等事务性的处理过程,不能发现这些海量的数据中蕴含的对企业生产和管理具有
面向方面软件开发(Aspect-Oriented Software Development,AOSD)是对软件系统中横切关注点进行模块化的新途径,面向方面建模(Aspect-Oriented Modeling,AOM)是AOSD中识别、分离