【摘 要】
:
在国际一体化大背景下,行业内及行业间的事务往来空前频繁,信息交流频率呈爆炸式增长。信息源由以往的单一环境、较小数据量、静态存储方式向分布式环境、流数据形式、动态处
论文部分内容阅读
在国际一体化大背景下,行业内及行业间的事务往来空前频繁,信息交流频率呈爆炸式增长。信息源由以往的单一环境、较小数据量、静态存储方式向分布式环境、流数据形式、动态处理逐渐转换。如何利用有限的硬软件资源从源源不断的数据流中提取出有价值的信息是目前IT行业炙手可热的研究课题。分布式环境赋予数据流频繁模式挖掘新的特性。单主机参与数据频繁项挖掘已经不适合目前海量数据实时产生的特征。传统的分布式数据流全局频繁模式挖掘保留的候选项过多,导致内存占用较大、计算资源浪费过多,进而造成网络通信代价较高,使得资源的合理利用率大打折扣。基于改进后的频繁模式挖掘模型能将候选项的规模控制在一定范围内,从而提高模式挖掘效率。由于采取了比较合适的保留候选项的条件,模式挖掘的正确性也可以得到保障。在分布式环境下,针对多源数据流全局频繁模式挖掘利用多站点的计算能力,将异信息源数据分别在本地挖掘。通过改进频繁模式树(FP-树)结构,减小数据项存储空间。利用网络通信技术将一次挖掘后的数据互通融合,实现了前端处理引擎向后端发送较小的约束模式信息。同时,通过前后处理引擎的信息交互,实现了动态控制约束模式信息的量级,从而大大缓解了模式信息频繁更新的通信压力。
其他文献
网络分析作为GIS最主要的功能之一,是地理信息系统的重要组成部分,在电子导航、交通旅游、城市规划以及电力、通讯等各种管网、管线的布局设计中发挥了重要的作用,是研究的一个
随着智慧医疗的兴起,大量的医疗数据资源被整合到一起。医疗大数据作为一笔宝贵的财富,它的知识挖掘已经成为当前学术领域的一个研究重点。由于数据量和冗余属性的增多,使得
面对国内广阔的高清市场,蓝光技术蓄势已久,如果采用蓝光,中国高清市场将继续受制于国外专利技术。在这样的背景下,中国拥有自主知识产权的采用红光技术的NVD播放机,于2006年
RTU是一种远端测控单元装置,负责对现场信号、工业设备的监测和控制。近些年来,在国内的RTU和DAU产品主要应用于电力行业的电网调度系统、变电站自动化控制,油田的自动化、输
数据挖掘是指从大量的、不完全的、有噪声的、模糊的、随机的数据中提取人们感兴趣的知识和规则的过程,数据挖掘的研究已经取得了重大的进展,而且被应用到众多的领域。关联规则
随着社会信息化的飞速发展,从人们的日常生活到企业的业务运营,都被日益渗透的信息系统所包围,对其依赖性也越来越大。尤其在金融、通讯、交通、保险等行业中,一旦关键数据丢
近年来,国家对教学改革不断重视,教育部相继出台《国家教育事业发展“十一五”规划纲要》等政策。随着教学改革工作的不断深入,完善智能化计算机辅助教学(ICAI)系统的开发已
随着数据分类技术的不断发展,科研人员提出了越来越多的分类算法,但是这些算法各具特点,在理论层面各有优势及不足,因此,选择哪一种或哪几种分类算法去解决分类问题的过程往
随着高清影像成为数字播放机的发展方向,大容量光盘的需求在不断增加,新一代多功能光盘NVD(Next-Generation Versatile Disc)的第二代产品研制被提上了日程。与第一代盘片规
移动Agent技术的诞生,带来了电子商务领域研究的革命,使智能电子商务成为未来电子商务模式的发展方向。然而,由于移动Agent的移动性和智能性等特点具有两面性,它给电子商务研