基于散列的频繁项集分组算法

来源 :计算机应用 | 被引量 : 3次 | 上传用户:zyh111111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Apriori算法是频繁项集挖掘的经典算法。针对Apriori算法的剪枝操作和多次扫描数据集的缺点,提出了基于散列的频繁项集分组(HFG)算法。证明了2-项集剪枝性质,采用散列技术存储频繁2-项集,将Apriori算法剪枝操作的时间复杂度从O(k×|L k|)降低到O(1);定义了首项的子项集概念,将数据集划分为以I i为首项的数据子集并采用分组索引表存储,在求以I i为首项的频繁项集时,只扫描以I i为首项的数据子集,减少了对数据集扫描的时间代价。实验结果表明,由于HFG算法的剪枝操作产生了累积效
其他文献
目前隧道设计主要采用工程类比法,即依据围岩级别选取相应的支护参数,但对于某些特殊地段,需进行特殊的论证和设计。以杨岗1号隧道进口浅埋偏压段为工程背景,通过强度折减法
针对复杂交通路段下的短时交通流量模型的参数估计问题,建立了基于宏观交通流量预测的状态空间模型,提出了基于正交自适应差分演化的无迹卡尔曼滤波(UKF)算法,解决交通流量预测动
以某简支工字型梁桥为工程背景,对桥梁的病害及成因进行全面检测和分析,得出桥下大方量填土是导致桥墩偏位和墩梁相对位移的根本原因。该桥存在落梁垮桥的危险,对该桥部分危
针对跟踪过程中运动目标形态不断变化及跟踪不精确导致鲁棒性差的问题,提出了一种运用聚类方法的分层采样粒子滤波算法。通过分层采样把采样空间分成多个部分,使采样点集中于被采样概率密度函数值大的部分,采样误差降低到了原算法的一半;聚类方法利用权重实现合理分配粒子,使粒子的多样性得到保持,因而粒子跟踪的精度得到了提高。实验结果表明,所提算法的跟踪误差不到原算法的一半,每个仿真时间里稳定性都有加强,而且跟踪精
结合明珠隧道基坑工程监测实例,简述基坑工程变形监测方案,分析监测数据成果及其变化规律,总结工程经验,为同类明挖公路隧道基坑监测工程提供参考。
共产党员的党性是党员先进性和纯洁性的核心内涵。党员干部在践行"两学一做"中,必须坚定信仰信念,强化政治意识,树立清风正气,勇于担当作为,不断加强党性锻炼和党性修养,防微杜
以添加Sasobit有机降粘剂的温拌沥青混合料为研究对象,采用浸水马歇尔试验和改良罗特曼试验,对比研究温拌沥青混合料(WMA)和传统热拌沥青混合料(HMA)的抗水损害能力差异。研究结