负关联规则挖掘中的频繁项集爆炸问题

来源 :清华大学学报 | 被引量 : 0次 | 上传用户:qtl8866
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决负关联规则挖掘中包含负项目的频繁项集数量爆炸问题,引入过频繁项集的概念,证明过频繁项集及其所有超集均不可能产生有趣的关联规则.在频繁项集生成过程中,必须对项集中包含负项目的个数进行限制.使用最小支持度、最大支持度、项集中最多包含负项目的个数2个参数来约束频繁项集生成过程的算法.实验结果表明: 所增加的2个参数是必要的,特别是当数据集中所包含的项目个数比较多时,只有恰当地设置2个额外参数,才能够保证挖掘过程的正常进行.
其他文献
Densities (p) and refractive indices (nD) of glycine (Gly), DL-alanine (Ala), DL-valine (Val) (0.02, 0.04,measured at 298.15, 303.15, 308.15, and 313.15 K. The
目的 评估汶川地震救援军人半年后生存质量的现状并分析其影响因素,为进一步的心理干预提供理论依据.方法 采用整群分层抽样方法抽取救援军人1060例,以健康状况量表(SF- 36)
基于代数变换和不可行内点方法的思想,首次对P*(к)阵线性互补问题提出了一种宽邻域不可行内点算法,并在较弱的条件下,证明了算法的全局Q-线性收敛性和多项式复杂性.该算法可
从准三能级Yb离子的能级结构出发,建立了Yb离子的抽运和激光速率方程,结合解析和数值方法,研究了Yb激光介质的抽运动力学过程,包括抽运激发效率、最低抽运强度、激光能量提取
为了进一步证明分层模糊系统在很好地解决了多变量模糊系统的规则数随输入变量个数指数增长的问题的同时,是否能够解决系统的参数个数随输入变量指数式的增长,推导一类二叉树
采用磁控三靶(Si,Sb及Te)共溅射法制备了Si掺杂Sb2Te3薄膜,作为对比,制备了Ge2Sb2Te5和Sb2Te3薄膜,并且采用微加工工艺制备了单元尺寸为10μm×10μm的存储器件原型来研究器
究了双频混沌信号驱动的混沌振子的广义同步和相同步问题.发现了反偏向的相同步和正偏向的广义同步,即响应振子可以优先与驱动强度弱的混沌信号达到相同步,而广义同步则先在
在设计宽带光学参变啁啾脉冲放大系统时,对色散源进行了理论分析和讨论。对光学参变啁啾脉冲放大系统的色散量以及各个过程中的高阶色散对脉冲时域和频域特性的影响进行了计
应用隧道效应所得到的能量谱计算配分函数,进而计算黑洞熵.当本结论取一级近似时,熵修正的对数项与考虑广义不确定关系对黑洞熵修正的对数项一致,然而在计算中没有不确定因子
以二乙胺为结构导向剂,在微波条件下合成了SAPO-34分子筛材料,并分别在空气和氮气氛下1073K焙烧.考察了氮气氛下分子筛表面碳改性后对材料表面及水、甲醇和乙醇吸附性能的影