【摘 要】
:
数据挖掘是从大量存储于数据库、数据仓库及信息仓库的数据中挖掘出用户感兴趣的知识的过程。关联规则的挖掘是数据挖掘领域中一个重要的研究课题。在传统关联规则挖掘中,事务
论文部分内容阅读
数据挖掘是从大量存储于数据库、数据仓库及信息仓库的数据中挖掘出用户感兴趣的知识的过程。关联规则的挖掘是数据挖掘领域中一个重要的研究课题。在传统关联规则挖掘中,事务数据库中的记录仅包含项目及其标识TIDs。虽然事务数据库中的数据存在于一定的环境中,如时间、地点和顾客等,但在传统的规则挖掘中都被忽略。对于上述包含环境信息的规则称为多维关联规则。多维关联规则能提供关于现实世界的更为有用的信息,因此对它的研究将是一件十分具有实际意义和广泛应用背景的工作。 本文我们讨论了多维关联规则挖掘的两类问题:事务内关联规则的挖掘和事务间关联规则的挖掘。下面简要给出解决方案: 对于事务内关联规则的挖掘,我们提出了一个新的数据结构--MFP-tree,它是由DP-tree和FP-tree组成,分别存储维模式和频繁项集模式。在此基础上,提出挖掘多维关联规则的算法MFP-growth。该算法利用数据方技术和“分而治之”的求解思想,实施在维信息引导下的规则挖掘。性能研究表明,该算法是高效的。 对于后者,我们首先介绍了多维事务间关联规则的概念,研究了度量准则:支持度和置信度。在Apriori算法思想的基础上,给出了求解该问题的算法EN-aoriori。为便于理解和简化,本文研究的重点集中在单维的情况下讨论。最后,对单维关联的拓广和现有规则的区别也给出了相应的介绍。
其他文献
该文简要介绍了公钥基础设施的发展现状和应用前景,分析了PKI的体系结构和其提供的安全服务,介绍构建PKI系统中所用到的安全和编程技术,并提出了一个基于X.509协议的PKI系统
近年来,随着智能家居概念的普及,智能家居的发展越来越快,很多智能的家居用品如智能冰箱、智能洗衣机等都逐渐融入了人们的生活。一些IT界巨头Google、微软等都在智能家居领域投
社交网络已经成为人们日常生活的一部分,越来越多的人加入社交网络以方便和亲友之间的交流。他们通过社交网络共享文章、照片和视频等内容,发表对生活的感言、对社会事件的看法
本文首先介绍了电子邮件管理系统的现状,指出在系统的服务器端邮箱管理和系统用户信息管理以及系统的发布与恢复方面,仍存在着不足之处,并认为活动目录技术为解决这些问题提供了
将软件构件技术应用于操作系统领域,针对操作系统软件特有的特性,提出操作系统构件的概念,分析操作系统构件的特征,结合青鸟构件库技术,设计.开发操作系统构件库,是该文的工
该文首先介绍了自动文摘的研究情况及存在问题,并给出了计算机自动文摘的一般模型.我们在具体的文摘系统实现时,应用了两种使用了自动聚合思想进行隐式章节划分的方法.该文从
随着信息技术的发展,计算机网络正以惊人的速度向各个领域渗透,它帮助人们可以在虚拟世界里从事越来越多的复杂活动。然而,网络在为人们提供便捷生活的同时,其带来的安全问题也越
数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,被信息产业界认为
论文在分析网络数据传输特点和实时多媒体交互特性的基础上,针对分布式网络结构中群组交互的特点,提出了一种分布式MCU工作模型,该模型采取了单组播相结合的数据传输策略,支
该文在介绍数据源向图和状态迁移图的概念、特性以及它们各自的设计方法的同时,分析并总结出了数据源向图和状态迁移图之间存在的联系,指出了这两个数据模型在数据库设计中的