【摘 要】
:
随着数据库技术的发展,其应用领域越来越广泛,而网络技术的出现,更使得数据量急剧增长;并且,数据格式也随着处理手段的多样化及各种应用的需要而变得越来越多样化.以至于当人
论文部分内容阅读
随着数据库技术的发展,其应用领域越来越广泛,而网络技术的出现,更使得数据量急剧增长;并且,数据格式也随着处理手段的多样化及各种应用的需要而变得越来越多样化.以至于当人们面对浩如烟海的大量数据时,变得不知所措.传统的简单统计信息已经无法适应海量数据的出现带给人们的新问题.数据挖掘技术就是在这样一种大背景下发展起来的,它的目的就是帮助人们从那些看似零散、杂乱无章的大量数据中抽取出对人们实际有用的隐藏在数据表面背后的知识.该文主要讨论了数据挖掘前期任务中几个关键技术,在前人已有成果的基础上,加上了自己独立思考后提出了一些方法,主要体现在下面几点:(1)高效检测重复记录的方法.采用该方法能够有效的提高数据清洗的质量,使得数据挖掘的质量得到了明显的改善.(2)改进的属性规约算法.进行数据规约时,由于例外属性、数值型属性的存在,使得传统方法在进行数据挖掘的时候,不能提供很好的挖掘基础,采用改进的方法,有效地改善了归约结果,提高了数据质量.
其他文献
工艺参数优化专家系统OTP-ES是在PC机上,以VC++6.0为开发平台研制的,用于模具加工行业优选加工用量参数的小型专家系统.我们以传统专家系统框架模型为基础,使用神经网络技术
该文系统而全面介绍了有关网络安全与防火墙的基础理论和技术发展状况.通过对防火墙 技术的分析,研究了这些技术在Linux操作系统下的实现方法,完成了Linux下防火墙系统uGuard
该文首先简单回顾了石油地震勘探的基本原理和计算机软件技术在其中的应用情况;接着介绍了作为一个现代地震勘探资料解释系统所应具备的功能和系统划分;随后就面向对象技术在
该文主要研究了多个FFSR协调控制中的几个重要问题.为了扩展FFSR的工作空间,提高FFSR的工作效率以及延长其在轨寿命,该文首先根据卫星燃料消耗与时间效率两种因素研究了FFSR
该文首先简单介绍了Linux和Linux的内核,然后从Linux内核在操作系统中的位置,Linux内核的抽象结构和内核中各个子系统之间的依赖关系,详细分析了Linux的内核结构;该文的重点
该文介绍了一种应用于WindowsNT操作系统下,采用双宿主主机体系结构的包过滤式防火墙(Firewall-ZX).文中详细讲述了该防火墙的设计原理、功能架构以及实现细节.该文以实际开
该文基于嵌入式操作系统、智能高速网络、CROWNFS流文件瓶颈问题解决算法及网络电视、数字电视ATVEF相关标准提出了一个新的S/C服务模式——DTVSP架构.DTVSP的设计参考了原有
该文介绍了电子商务的概念和发展,网上银行的概念、国内外发展状况和java、servlet、seblogic、证书等网上银行的实现技术,分析了完整的网上银行所应具有的各方面的功能,并对
处在知识经济时代的今天,知识管理已成为企业提升竞争力的核心要素。信息技术是知识管理技术的基础。知识管理技术不是新生儿,而是现有技术的重新组合,其中最重要的是文档管理、
随着教育信息技术的发展,教学活动网络化、集成化是当前教育的又一特征。开发基于网络的教师集体备课系统正符合当今时代的要求。本文首先对基于网络的教师集体备课活动进行了