【摘 要】
:
自20世纪80年代后期数据挖掘理论出现以来,数据挖掘有了突飞猛进的发展。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们
论文部分内容阅读
自20世纪80年代后期数据挖掘理论出现以来,数据挖掘有了突飞猛进的发展。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。本文主要关注数据挖掘的一个重要领域:关联规则分析。自1993年R.Agrawal提出了关联规则问题以后,引起了众多专家学者的广泛关注,使关联规则挖掘成为数据挖掘领域里最为活跃的研究方向之一。本文首先介绍了关联规则问题及其两个典型算法——Apriori算法和FP-growm算法。在分析了Apriori算法的性能瓶颈和基于Apriori算法的改进算法的基础上,提出了一种基于聚类和矩阵的关联规则挖掘算法——CM-Apriori算法,该算法只需扫描事务数据库一次,直接按事务项数聚类成矩阵,每次只需对部分聚类矩阵进行运算,就可以生成频繁项集,大大减少了扫描数据库的次数和计算成本,从而有效提高了算法的运算效率,实例分析和性能研究表明该算法优于同类算法。
其他文献
东湖农场处在平原水网地带,是个规模较小的示范农场。有水田560亩,生产以水稻为主。 建场十三年来,在上级党和政府的正确领导下,依靠全场职工,连年获得了农业大丰收。1952年
研究证明:现代社会出现的大量“现代病”如冠心病、癌症、高血压、糖尿病等,都与人们的日常饮食有很大关系,而环境污染的日益严重,使人们越来越喜欢纯天然、无污染、不添加化
思想战线要清除精神污染,是党中央给我们提出的一项新的战斗任务。精神污染的实质,是散布形形色色的资产阶级和其他剥削阶级腐朽没落的思想,散布对于社会主义、共产主义事业
12月11日,应埃及国家文明博物馆邀请,由江苏省档案局(馆)、南京市和苏州市档案局(馆)共同举办的《江苏与“一带一路”走进非洲展》在埃及首都开罗新建成的埃及国家文明博物馆
由于生产力的不断发展,全球性生产能力过剩,产品生产的决定权向消费者转移,买方市场已经形成,产品质量已成为竞争制胜的重要前提。 在供应链管理环境下,任何企业都只是供应链上
改革开放30多年以来,中国经济发展取得了举世瞩目的成就,截至2012年中国人均GDP已达到6100美元(国家统计局)。但是中国城乡二元结构仍未彻底消除,成为制约中国城乡经济协调发
城市化是我国全面建设小康社会和推进现代化的重要途径。因此,探索城市化的发展模式,寻求其发展方向,是新世纪发展进程中需要解决的重要问题。本文以榆中县的农村城市化发展
6 0管理法是近年来被企业界广泛关注的一种质量管理方法,自二十世纪八九十年代以来在通用电气和摩托罗拉等大公司获得了成功的应用。本文从质量管理的历史出发,分析了60管理法
本文主要讨论在IT环境下,计算机审计所依赖的审计数据质量的评价以及数据质量对审计风险作用的和影响。
计算机审计是目前审计领域中的极受关注的话题,也正是因为它的新
近来,许多报纸加强了关于贯彻“百花齐放,百家争鸣”方针的宣传报道。人民日报学术版刊登了一些新、老学者写的较有份量的学术论文,就中国历史上若干人物的思想(如庄子、刘