Web数据挖掘中的数据预处理

来源 :计算机工程 | 被引量 : 0次 | 上传用户:victor9808
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web数据挖掘是分析网络应用的主要手段.其数据源一般是网络服务器日志,然而日志记录的是杂乱的、不完整的、不准确的并且是非结构化的数据,必须进行数据预处理.文章将预处理过程分为3个阶段一数据清洗、区分使用者、会话识别,并提出了一个高效的Web数据挖掘预处理结构WLP和相应的算法.
其他文献
自古以来陕西是国家政治、经济、文化的中心,是中华文化的源起之地。其现存传统村落形态具有鲜明的地域特征。传统村落是人类聚居文化中一个或数个血缘群体共同繁衍生息的特殊空间聚落。即是社会基层文化的集中体现同时又是地域文化、地方精神的物质体现。时至今日,传统村落已逐渐失去其立足之本受到“自上而下”的瓦解正在被来自城市的新型建筑吞噬着,传统村落特色形态的湮没与传统价值观消亡所带来的文化失调受到了社会各界的关
介绍用面向对象的分析方法设计分布式交互仿真(DIS)仿真数据库,具体描述对象定义语言(ODL)模型映射为关系模型实现数据库的方法.
深部调驱技术是以深部调剖为主,在“调”的基础上又结合了“驱”的效果,并具有提高波及系数和驱油效率的双重作用。向地层中注入具有相当封堵作用的可动的化学剂,对地层进行
山西省运城市万荣县境内的万荣隧道在DK557+222DK557+248区段内下穿闻合高速公路,该区域内的土体为砂质老黄土和细砂,围岩级别较低,为V级围岩。本文采用FLAC3D数值模拟软件,
拉格朗德河是加拿大的主要河流之一,其水力资源从70年代开始分两期开发,全流域共规划9个电站,一期开发3个电站,总装机容量10282MW,其中包括著名的拉格朗德-2电站,二期开发6个电站,总装机容量15755MW。整个