多值关联规则挖掘算法的研究

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:laofei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今世界,数据日益增长,在大量的数据中隐藏着许多重要的信息,如何发现有价值的信息或知识是一项非常艰巨的任务。数据挖掘就是为了满足这种要求而迅速发展起来。数据挖掘就是指从大型数据库或数据仓库中提取隐含的、先前未知的、对决策有潜在价值的知识和规则。在事务数据库中挖掘关联规则是数据挖掘领域中的一个非常重要的研究课题。关联规则按处理对象的不同可分为布尔型关联规则和多值型关联规则。布尔型关联规则挖掘是在属性值为布尔量的关系表中发现属性值同时为“1”的属性之间的关系。然而在现实中,事务数据库中包含的属性还有多值情况,因此研究如何挖掘多值关联规则具有重要意义。本文就数据挖掘中的多值关联规则挖掘进行了一些研究,研究内容主要包括:提出了一种新的多值关联规则挖掘算法MQAR,该算法结合频繁项集挖掘中的FP-tree和高维数据聚类算法CLIQUE,设计了一种树形结构DGFP-tree来存储事务数据库中的信息,并通过搜索树中路径来挖掘存在聚类的低维子空间,从而将多值关联规则挖掘问题转化为创建DGFP-tree、利用该树搜索高密度单元、形成聚类的过程。该算法避免了传统多值关联规则挖掘算法中的“最小支持度”和“最小置信度”问题,且能够挖掘出部分属性之间的关联规则。实验结果表明该算法能有效地挖掘多值关联规则。针对多值关联规则挖掘过程中属性离散化方法的不足和组合爆炸等问题,提出了一种基于模糊聚类和互信息的多值关联规则挖掘算法FMI-Miner。该算法首先采用模糊C均值聚类算法进行多值属性的离散化,然后根据离散化属性间互信息的大小来挖掘频繁模糊项集以产生关联规则。实验结果表明,算法FMI-Miner有效地减少了挖掘过程中的计算量,提高了算法的性能,并且挖掘出的多值关联规则更容易让人们理解。
其他文献
目的 观察不同剂量的三七总甙对体外培养大鼠成骨细胞增殖、分化及OPG表达的影响,探索体外作用的机制和最佳剂量。方法 第2代培养的成骨细胞分别加入终浓度为Oμg/ml、10μg/
《劳动合同法》第八十二条规定:"用人单位自用工之日起超过1个月不满1年未与劳动者订立书面劳动合同的,应当向劳动者每月支付二倍的工资。"为了避免二倍工资索赔,企业越来越
服务性新闻是为受众提供各种生活信息的报道问题,与企业的营销软文有着本质的区别。但当下部分媒体将软文伪装成服务性新闻,这不仅恶意透支媒体公信力,还会最终蚕食掉整个媒
日本艺术歌曲是由日本明治维新的教育改革后所发展起来的。1900、1901年日本的近代音乐之父泷濂太郎创作的《荒城之月》和《花》以其优美的旋律,才开拓了日本艺术歌曲创作的
钢管制造厂的钢管传输设备虽然是行业内的辅助设备,但如何做好传输设备,关系到生产效率的提高、人工成本的降低、人身安全的的保证和设备的可靠运行。到目前为止,国内钢管制
松科1井是松辽盆地第一口全取心科学探井,对白垩系泉三段顶部至泰康组底部地层进行了完整揭示,取心率高达96.46%。其为松辽盆地上白垩统事件沉积和高分辨率层序地层的研究提
WTO总干事拉米在2006年7月举行的WTO总理事会非正式会议上宣布,中止多哈回合谈判。历时5年多的多哈谈判告一段落,多边贸易体制的发展又一次遭受挫折,引起各方的广泛关注。2005年
农业和农村经济虽然是相对独立的经济部门和经济区域,但它服从于城市功能和城市发展的总体需要.因此大城市农业和农村经济发展与城市郊区的功能定位密切相关.本项研究将从两
一、欧盟共同农业政策农业一直是欧盟最敏感的贸易领域之一,为了实现真正的联盟,"共同农业政策"(CAP)应运而生.
一、绿色贸易壁垒的成因分析  绿色贸易壁垒是指在国际贸易活动中,一国以保护环境为由而制定的贯穿于产品的研制、开发、生产、包装、运输、使用、循环再利用等整个过程的