基于PC集群的并行FP-Growth算法的研究与实现

被引量 : 0次 | 上传用户:frjzj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
FP-Growth算法是当前挖掘频繁项集算法中应用最广,并且不需要产生候选项集的频繁项集挖掘算法。它通过对源数据库的两次扫描,将全部数据项信息压缩到一个称为FP-tree的数据结构中,将数据库频繁模式的挖掘问题转化成挖掘FP-tree的问题。然而,在处理海量数据时,生成的FP-tree数据结构极为复杂,生成频繁集并挖掘频繁项集生成强关联规则过程,对内存和处理器要求极高。并行算法可以将计算任务合理地分配集群中的各个计算节点,因此对并行FP-Growth算法的研究在频繁项集挖掘中具有十分重要的现实意义。本文深入研究了并行计算理论、高性能计算集群和FP-Growth算法,对并行计算机的体系结构、并行算法的设计方法、高性能计算集群的创建技术和FP-Growth算法各个步骤有良好的理解。为了实现FP-Growth算法的并行化,本文对并行FP-Growth的一些典型算法进行了分析,发现它们主要是基于硬件同构并行计算平台,对算法中计算节点负载均衡在硬件异构并行计算平台并未加于考虑,因此,这些算法在硬件异构并行计算平台中的性能不佳。为了实现PC集群下的并行FP-Growth算法,本文设计和实现了一个高性能计算集群,提出并实现了一种在硬件异构计算平台上的并行FP-Growth算法。实验结果表明,使用本文所提出的算法后,在仅有三个计算节点的集群环境中加速比可达到2.3以上。
其他文献
<正>这是一节校际间的交流研讨课。《看云识天气》是一篇多次入选教材的说明文。由于人们对"说明文"这种文体的提法提出了质疑,全日制义务教育语文课程标准对此采取了回避的
<正>《〈论语〉十则》选入初中语文七年级上册(义务教育课程标准实验教科书),文后两处注释我以为是值得商榷的。下面试作分析。
过氧化物例如青蒿素和鹰爪素等由于具有独特的抗疟活性,备受合成有机化学家和药物学家的重视。目前已有足够的研究证明,过氧官能团是这些化合物具有抗疟活性的关键。另外,过氧化
《鸿门宴》作为戏说历史颠覆之作,得到了市场的有力回馈,获得了过亿票房,得到了电影观众的认可,引发了人们对古装历史电影更多的讨论。通过对戏说历史之作的多角度思考,不禁
阵列测向技术是用来确定信号波达方向的常用技术,进而实现对目标定位。本文结合“接收多波束测向技术”和“阵形优化设计”两个实际研究项目,系统分析了阵列测向算法、数字多波
新型家族观念对旧观念的替代,显示的是社会构成者意识的变化,它也必将导致社会整体思维方式的变迁;近年韩国导演对家庭秩序重组和多元家庭形态可能性的关注,意在创建独立的审
随着软件行业的快速发展,产生了业务基础软件开发架构(Business FoundationSoftware Platform,BFSP)。它以业务模型为导向和驱动,以快速构建应用软件为目的,使管理与业务人员参与应
【目的】研究卵巢浆液性癌中k-ras、P53基因突变及Pax2、P53、Ki67蛋白的表达特征,探讨卵巢浆液性癌两级分级系统在临床病理诊断中的应用价值,为提高准确诊断及合理的临床治疗
土工织物是应用于土木工程中的一类纺织品。其主要原料来自石油的下游产品——聚酯纤维、聚酰胺纤维、聚乙烯、聚丙烯等,通过织造或非织造的方法制造而成。由于生产制造成本低