【摘 要】
:
关联规则揭示项集间有趣的相关联系,是数据挖掘的重要研究课题。自1993年R.Agrawal、R.srikant首次提出该问题以来,已经出现了许多关联规则挖掘算法。这些算法大多基于Aprior
【出 处】
:
华北电力大学(保定) 华北电力大学
论文部分内容阅读
关联规则揭示项集间有趣的相关联系,是数据挖掘的重要研究课题。自1993年R.Agrawal、R.srikant首次提出该问题以来,已经出现了许多关联规则挖掘算法。这些算法大多基于Apriori算法,在挖掘频繁模式时需要产生大量候选集,多次扫描数据库,时空复杂度过高。本文提出一种基于划分的挖掘算法YD_Apriori,扫描1遍数据库,查找出频繁1-项集,并依照项集支持度不同对数据库进行划分,然后通过事务树方法构造出每个分块的局部频繁项集,然后按照事务树依次合并链表,并产生新的频繁项集,所有局部频繁项集和新产生的频繁项集构成最终满足条件的所有频繁项集。生成关联规则时采用Apriori算法由频繁项集生成关联规则的算法,最终生成需要的关联规则。本文重点在于频繁项集的生成。
其他文献
中文自动分词是中文信息处理的一项重要的基础性任务,是机器翻译、问答系统、自动文摘等技术的基础,也是实现中文搜索引擎所必须的关键技术之一。然而由于汉语自身的复杂性,
本文致力于完成C语言源程序的系统依赖图的构造,系统依赖图是静态分析工具的基础,在逆向工程中具有重要意义。系统依赖图的构造可以归结为控制流分析和数据流分析,控制流分析
多媒体技术和互联网技术的发展,使人们能够方便的获得各种多媒体信息。数字化后的多媒体信息具有易于存储、发布以及修改等优点,同时,多媒体信息被非法复制与篡改也变得越来
大规模自然或人为灾害通常会对人们的生命和财产造成难以估量的损失。在灾后救援中,救援小组根据收集到的受困人员信息,来确定下一步救援行动如何开展。然而,由于基础设施被
随着社会进步和信息技术的发展,互联网正在改变着我们生活的方方面面,各行各业都在颠覆传统,向着互联网模式迈进。从之前学习资源、购物方式和联系方式的互联网化,到如今的出行、
信息技术的发展推进了人类社会的现代化进程,而信息系统的安全问题却给人们的工作和生活带来了诸多麻烦。关注信息系统的安全,首先就要关注计算机终端的安全。基于纯软件的安
本文基于数据挖掘技术和关联规则挖掘理论,对经典的关联规则挖掘算法Apriori算法进行了深入地学习,给出了其不足之处。针对算法的缺陷,通过引入哈希函数、建立分组表和分组查
本文以山东电子职业技术学院环境为虚拟空间,研究了基于几何建模的虚拟现实漫游技术。 本文共为五个部分,第一部分对虚拟现实技术进行了概括性介绍,介绍了国内外虚拟现实的研