二进制的交叉挖掘关联规则研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:ly0496lf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了易于产生候选频繁项目集和计算项目集的支持数,提出了基于二进制的关联规则挖掘算法,但在搜索候选频繁项目集时仍从集合论出发,沿用传统搜索超集或子集的方法,在一定程度上效率受到了限制;为此提出了一种基于二进制的交叉挖掘关联规则算法,通过数值的递增和递减交叉方式自动产生候选频繁项集,缩短了候选频繁项的搜索空间,并在计算支持数时通过数字特征减少了扫描事务的个数,算法的效率得到了明显提高;该实验结果表明:与现有的二进制关联规则挖掘算法相比,算法是快速而有效的。
其他文献
提出了未编码DUS.IM系统的网格译码。将DUSTM系统视为具有全状态转移的网格结构,采用维特比软译码算法进行信号解调。仿真结果表明该方案相比传统的基于单符号最大似然解调的DU
引入了一种广泛而实用的方法——基于量子行为的粒子群算法的理论应用于系统辨识领域,QPSO算法不仅参数个数少,随机性强,并且能覆盖所有解空间,保证算法的全局收敛性。仿真实
对于运输能力具有随机性的海运集装箱舱位超订问题,将运输能力假定为离散型的随机变量,考虑超订水平对商业信誉的影响,在具有空箱调运需求的情况下建立了以期望总成本最小化为目
粗分类是提高汉字识别速度的主要手段。将RBF(Radial Basis Function neural network)神经网络用于汉字粗分类,采用汉字四边码和粗网格作为汉字粗分类的特征以进行比较。分别对GB2312-80一级字库印刷体及手写体进行实验,实验结果表明将RBF神经网络用于汉字粗分类比通常使用的欧式距离作为分类器有较好的性能。
Bag-of-Words模型对于图片分类来说是一种非常有用的技术,它利用事先定义好的"可见字"为每张图片建立一个特征向量。提出了一种新的统计方法来发掘可见字对于每一类图片的区分能力,再利用线性模型合并"可见字",从而为每张图片构造新的特征向量。实验结果显示这一算法能够增强特征向量的区分度,进而提高图片分类的性能。