关联规则挖掘算法的改进与应用

来源 :江西理工大学 | 被引量 : 0次 | 上传用户:zshihao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,关联规则作为数据挖掘领域中一个非常重要的研究课题,己经取得了令人瞩目的成绩,但在实际应用中,随着数据库规模逐渐增大,出现了随着数据量递增而算法挖掘效率下降的问题,具有应用局限性。因此,必须研究和改进现有的算法,使其具有更高的效率和更广阔的应用前景。首先,本文对数据挖掘技术进行全面的分析,从数据挖掘的定义、任务、体系结构以及数据挖掘的模型进行研究,特别是对数据挖掘的方法进行了细分和比较。其次,本文研究了关联规则中经典的Apriori算法及其改进算法。为了解决这些算法在候选项目集和执行时间方面存在的问题,结合关联规则的性质和布尔向量的关系运算思想,提出了基于布尔矩阵的关联规则挖掘算法(Algorithm Base on Boolean Matrix)和幂集合算法(Power.Set)。布尔矩阵的关联规则算法在挖掘过程中仅扫描数据库一次,而且不产生候选项目集,从而减少了生成频繁项目集的时间开销,提高了算法效率;幂集合算法完全脱离Apriori算法的结构,它主要利用拆解交易记录的方式进行,其主要步骤是将每一条读入的交易记录根据特定原则快速拆解成各项目集,当数据库经过一次扫描后,表示所有的交易记录也同时被拆解完成,随后输入最小支持度和置信度,就可快速挖掘出符合使用者需要的频繁项目集,进而得到其关联规则。两种算法都达到了算法改进的目的。为了验证算法的性能,本文采用了实例法和实验法对提出的新算法和经典的Apriori算法进行了对比测试。试验结果表明,两种改进的算法在效率上明显优于Apriori算法,而且挖掘的数据量越大,数据库变化快,改进的算法效率越高,两种算法都具有较好的可扩展性和较广阔的应用前景。最后,将基于布尔矩阵的关联规则算法应用在商场营销中,发现物品之间的关联性,为决策者提供指导和数据支持,从而提高企业利润。
其他文献
银行信贷登记咨询系统为防范金融风险起到一定作用,但该系统在实际运行中还存在一些问题需要在程序设计、实际操作中加以改进,以提高系统资源的利用率和信息共享,促进其作用
汽车空调用的CFC工质对臭氧层有破坏作用,因此对CFC工质的替代势在必行.HFC134a和HFC407c工质因其不损害臭氧层,并且在生产技术经济方面都是可行的,正在汽车空调中推广.
网络银行的风险控制问题已成为当前金融业研究的热点之一.通过透视网络银行的风险表现,分析其风险成因,并从法律角度,提出防范与化解网络银行风险的对策.
应通过建立科学的学科知识体系、合理的提升机制以及明确的职业领域等途径,推进高校辅导员队伍职业化与专业化的建设。
由于目前农户信用分析不规范、不科学,造成农村信用社对农户小额信用贷款难以把握和操作,这也是影响农户小额信用贷款积极推广的重要制约因素.对农户信用分析进行理论探讨和
当前,按照存款准备金管理体制,基层央行对城乡信用社、城市商业银行、农村商业银行、企业集团财务公司等金融机构缴存存款准备金行使管理、动用、处罚等职能。货币信贷部门负责
目的探讨在开展扩张型心肌病心衰疾病治疗工作期间卡托普利+地高辛药物的应用效果。方法选择本院2015年3月至2017年4月收治的140例扩张型心肌病心衰患者作为实验对象,凭借数
高中英语新课标要求培养学生的文化意识,并且在加强学生理解能力和语言运用能力的同时,不断开拓学生的文化视野,让学生在不断对比和领悟英语文化和本民族文化中,培养自身的人文精
为了解当今大学生性观念和性行为的现状,采用问卷调查方法共调查了广州地区八所大学的1136名本科生。结果表明大学生现有性知识的主要来源(占81%)是书籍、报刊杂志以及广播电视等媒体。