【摘 要】
:
随着计算机的普及应用和计算机网络的飞速发展,在过去若干年里,无论是商业企业、科研机构或者政府部门,各个领域都积累了海量的并以不同形式存储的数据。面对如此多的数据,人们不
论文部分内容阅读
随着计算机的普及应用和计算机网络的飞速发展,在过去若干年里,无论是商业企业、科研机构或者政府部门,各个领域都积累了海量的并以不同形式存储的数据。面对如此多的数据,人们不再满足于日常的事务处理,而是更加关注能否从形式不同的,分散的,纷繁复杂的数据环境中得到有用的决策信息,从而可以做出正确的分析和决策。数据仓库和数据挖掘技术的产生为这个领域数据难题提供了一个很好的解决方案。
数据仓库是一个面向主题的、集成的、不可更新的且随时间不断变化的数据集合,用来支持管理人员决策的系统,它可以把领域内以不同形式存储的海量数据集成在一起供分析人员进行分析。数据挖掘是一个从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,数据挖掘技术为领域数据分析人员提供数据分析的方法。本文首先对数据仓库和数据挖掘技术进行了研究,提出领域数据仓库构建的三层模型结构和领域数据挖掘系统开发方法。进而重点研究了关联规则挖掘算法,通过深入研究Apriori算法及其一些现有改进算法,针对Apriori算法的不足提出四点改进,设计完成了基于项集重排序的Apriori_Sort算法。
为了验证改进后算法的有效性,本文做了大量的实验,实验证明,改进后的算法由于大大减少了候选项集的数量从而提高了算法的效率。将Apriori_Sort算法应用到能源领域的数据挖掘系统中,对多维能源数据进行了关联规则挖掘,通过对关联规则分析得到一些能源领域内一些节能方案。最后,对领域数据挖掘的进一步发展和能源数据挖掘的进一步完善做出了展望。
其他文献
曲面细分由于它自身的优点,在曲面造型中具有举足轻重的作用。很多经典的曲面细分方案都是通过对B-Spline曲面的研究而提出来的,比如基于二次B-Spline曲面的Doo-Sabin细分和
随着IMS技术的不断兴起,通信的环境已经发生了很大的变化,从简单的电报电话方式扩充到包括语音、数据和多媒体在内的多元化通信,网络融合技术应运而生。网络融合的趋势打破了
近年来,随着城市机动车保有量的持续增长,交通违章和违法行为越来越多,如多辆车结伴作案、出租车罢工罢运、酒驾等,对城市安全带来了巨大隐患。如何快速识别以上交通行为模式对公
业务流程是指在企业组织内部“流转”的一系列相关的活动,始终反映着企业的经营状况,工作流技术可以使企业管理人员更关注业务流程的本质,提高企业竞争力,目前很少有工作流产
PKI作为一种普适性的安全基础设施,能够保障网络安全,解决网络通信中的信息安全问题。PKI要想给用户提供身份认证与授权,信息完整性、保密性与不可抵赖性的保证,其基础就在于
在汽车保有量逐年增长的当今社会,公共交通是解决城市交通拥挤问题的主要手段。
大力发展公共交通能有效的减少道路交通量,减缓交通压力和对环境的污染压力。智能公交调度
进入二十一世纪以来,随着互联网的迅速发展,IT企业需要将其业务和产品包装成了服务,以达到在互联网上共享服务的目的。论文根据国家“十一五”科技支撑计划重大项目“现代服
基于角色的访问控制模型是近十几年来在自主访问控制和强制访问控制的基础上发展起来的一种重要的访问控制技术。基于角色的访问控制模型的特点是通过分配和取消角色来完成用
在信息社会中,随着计算机技术、通信技术、网络技术的快速发展,网络已成为人们获取信息的一个重要途径。人们预测,在不久的将来网络媒体将会取代平面媒体成为人们获取信息的
计算机软件技术广泛应用于各个领域,人们对于软件系统的可靠性要求日渐提高,实时软件可靠性是关注的焦点之一,而软件可靠性测试是提高软件可靠性的一个重要方法。随着面向对