基于单向FP_tree的最大频繁项集挖掘算法研究

来源 :电子世界 | 被引量 : 0次 | 上传用户:aqxielin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
频繁项集挖掘算法是数据挖掘的主要研究方向。目前主流的频繁项集挖掘算法有:产生候选频繁项集和不产生候选频繁项集两种,分别是Apdori算法、FP_growth算法。这两种算法各有优缺点。本文在分析现有算法的基础上,充分利用FP_tree信息压缩的优点,设计出一种产生候选项集的最大频繁项集挖掘算法。该算法首先构造一棵单向FP_tree,再利用最大频繁项集特性对候选项集进行剪枝,不需要扫描数据库计算候选项集的支持数。仿真实验表明,与现有算法相比,该算法的时、空效率都有巨大提高。
其他文献
广州地铁大石控制中心HiPath4000交换机通过中国一号信令与市话局连接,当交换机的信令板发生故障时会导致市话接通率降低。本文探讨了信令板故障导致市话接通率下降的原因,并提
对固网移动网融合后为更好的向企业客户提供多种接入方式的端到端的解决方案进行了研究,解决在统一平台上引进移动分组网的APN技术及IP城域网中的VPDN技术后,实现对企业用户的
随着科技的进步,工业化进程不断深化,信息技术也在同步发展,PLC控制系统不断深入我们生产生活,现阶段,PLC控制系统的优化设计已经成为社会发展得必然选择,而且可靠性是进行PLC控制