面向Web挖掘的数据预处理研究

来源 :西华师范大学 | 被引量 : 0次 | 上传用户:janyang256
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文共分为八章。论文第一章是引言,主要介绍了论文研究背景及意义、国内外研究动向和论文各部分的内容安排。第二章是数据挖掘和数据预处理,简要介绍了数据挖掘的相关知识,并指出了数据质量对挖掘产生的影响和原始数据存在的几方面的问题,以及数据预处理的各种方法。第三章是Web挖掘,在本章中介绍了Web挖掘的产生以及它的应用;给出了Web挖掘的定义以及它与数据挖掘的区别和联系,介绍了Web挖掘的步骤;并详细研究Web挖掘的分类和Web挖掘常见的技术。第四章是Web内容挖掘预处理,在本章中给出了Web挖掘的预处理综述。第五章是Web结构挖掘预处理,介绍了结构挖掘预处理的过程及方法。第六章是Web使用挖掘预处理,对使用挖掘预处理方法进行了分析。第七章给出了三种预处理方法的实验分析,第八章对论文所涉及的工作进行了客观的总结,提出了还存在的问题,并对进一步的开发与改进工作提出一些设想。
其他文献
有效的估算是软件项目管理的基础,只有使用科学的方法对目标软件系统的规模、工作量和进度做出合理的估算,我们才能在预算内按时保质顺利地完成项目。工程实践表明,目前应用广泛
建设“数字城市”是社会发展的大方向,是每一个城市经济建设可持续发展的必然趋势。房产是城市组成中一个不可缺少的要素,而数字房产也就成为数字城市建设中不可或缺的基础信息
  网格是一种为了在动态变化的、拥有多个部门或者团体的复杂虚拟组织内实现灵活、安全的协调资源共享与问题求解而出现的新兴技术,近年来的飞速发展使越来越多的应用程序可
随着软件应用的日益广泛及重要性的不断增加,人们对软件质量的要求也越来越高。可靠性作为衡量软件质量的重要特性,其定量评估和预测已成为人们关注和研究的焦点。软件可靠性模
本文首先对UML和RUP的基本理论及其应用进行了分析和总结。接着,分析了当前企业级应用中最常见的J2EE技术,其优势在于它为搭建具有可伸缩性、灵活性、易维护性的业务系统提供了
本文以“实验教学示范中心信息资源应用管理系统”项目为背景,分析了其多子系统的结构特点,为实现安全和高效的访问控制,提出了使用单点登录的技术方案。针对目前流行的三种解决
本文首先简单介绍了北京大学网格协作平台Harmonia,随后主要介绍了它的底层部分H-执行环境的设计和实现,H-执行环境把遗产程序的运行和监控抽象为运行、状态监测、数据传输、安
计算机技术在医疗领域的应用方兴未艾。医疗行业需要实用性强,易于普及,成本低廉,作用范围广,功能全面的医院信息管理系统。本文在分析了现有的医院信息管理系统的基础上,根据医院
企业级软件配置管理信息系统现有设计有4个主要技术问题:可用性、大量的并发客户机支撑、不断增长的存储空间和客户机多种配置。 本文采用了基于LVS集群的高可用性、高伸缩
本论文的研究目的是搭建一个telnet终端仿真并相应实行Web扩展功能的校园BBS系统;采用Firebird代码为基础,用C语言对Firebird进行二次开发,完成一个符合中国地质大学(北京)校园