挖掘有效关联规则算法的分析与设计

来源 :郑州大学 | 被引量 : 0次 | 上传用户:shumoljw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是从大量数据中发现人们感兴趣的、隐藏的、前所未知的知识,而挖掘关联规则是一个重要的数据挖掘问题。本文对目前基于支持度-置信度框架的关联规则挖掘算法进行了分析与研究,发现利用支持度、置信度这两个标准来衡量关联规则存在两个主要问题: 1.有可能挖掘出一条即使支持度和置信度均很高,但却是不感兴趣的、虚假的,甚至是误导的关联规则。 2.不能挖掘出带有否定项的关联规则。 为了解决这两个问题,本文首先提出了增加兴趣度的第三个度量值——相关支持度。当挖掘出一条关联规则的支持度、置信度、相关支持度同时大于最小支持度、最小置信度、最小相关支持度阈值时,才被认为是有意义的模式;其次把相关支持度小于1的项集引入否定项集,来产生带有否定项的规则。 通过以上改进,设计出一个较好的、有效的关联规则挖掘算法,实现了尽量仅产生有趣模式,优化了关联的挖掘。
其他文献
STEP标准则是针对产品数据进行计算机可解释的表达与交换的国际标准.其目的是对整个生命周期提供能够描述产品数据的中性机制,且独立于任何具体的系统.这种描述的本质是使其
该文的目的在于简化适应性移动计算应用程序的设计、开发、发布和维护.我们不仅提出能够用来开发环境敏感适应性应用程序的技术和原型,还对低层的运行系统进行了部分实现.文
该报告分三个部分:首先给出问题的物理背景,对传统的自洽迭代过程和国外学者对类似线性问题的计算方法做了介绍,提出近似算法的思想.其次,我们对该问题比数学理论上进行分析,
该文以商业领域应用软件开发平台为工程背景,结合了构件技术、领域工程和WindowsDNA技术,对商业领域应用软件开发平台中POS系统的设计和实现中的主要问题和解决方法进行了研
利用计算机系统控制多个图形部件驱动多个监视器或投影仪得到基于拼贴的显示,是突破现有显示技术制约,实现千万像素以上的高清晰度大尺寸显示的有效手段。采用PC机群系统来驱动
该论文的主要内容是对集理论中1-可扩图及圈边连通度的算法.一个图是1-可扩图如果它的每一条边都包含在一个完善对集中.一个图的圈边连通度是指最小圈边割的边数.该论文包括
该文详细剖析了作者在Inferno操作系统上研究开发的TeleKaron系统.该系统是一个安全的移动代理的底层支持软件.在对Inferno操作系统作了必要的介绍之后,研究人员开分析TeleKa
本文以ERP与电子商务的结合作为研究课题,根据ERP的基本原理和内江峨眉柴油机厂的实际情况,建立了该厂的物料管理系统模型。在此基础上,设计了以实现零库存为主要目标,物流管理为
该文首先介绍了并行程序和串行程序调试的区别,并简要讨论了多进程(多线程)的出现引入的调试问题,包括死锁,错误移位,竞争条件,不确定性,不可再现性等;之后介绍了目前在并行
该文主要回答了在SMP机群下进行高性能程序设计的问题:主要包括共享/分布式存储混合并行的分析和编程设计,开发多存储层次的延迟消除技术和开发多线程并行的延迟隐藏技术,并