关联规则挖掘算法及其在Web挖掘上应用的研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:maxyz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于应用性的数据的爆炸式增长(如商业分析),及计算机的软硬件技术的发展完备,数据挖掘已经成为近几年来应用最广泛的分析数据的工具。挖掘重要数据仍然需要配合许多其他领域的技术才能得到完善有效的结果,其中包括机器学习,人工智能,统计学原理,数据库系统,数据可视化等。然而目前大多数挖掘关联规则的算法往往必需多次扫描事务数据库才能达到要求的目标,这样重复性的数据库存取动作将会导致过多的执行时问浪费在I/O动作上,另外在频繁集生成规则时现有的算法没有考虑到规则的大量冗余,为了解决这个问题本文提出了一个不需要生成候选集同时有效的去除生成规则时产生大量冗余的算法QAIS,来提高关联规则生成的速度,并且在此算法基础上提出了新颖的关联规则增量更新算法AIU,通过应用合成数据验证了QAIS/AIU算法的有效性,由试验结果来看这个方法确实能更有效且准确地获得事务数据库的关联规则,尤其适合挖掘超大数据库中高支持度下长模式的挖掘。然后论文介绍了关联规则的一种扩展—时间序列模式挖掘方面的算法,给出了Web日志文件挖掘的高效、新颖的改进算法,并用实验验证了此种方法的有效性。论文的最后讨论了关联规则挖掘领域面临的几个问题。
其他文献
随着Internet的普及和电子邮件的广泛使用,电子邮件的防毒迫在眉睫,邮件过滤网关硬件专有系统的开发正好迎合了这一需求。本课题基于POP3协议的邮件过滤网关的研究是对冠群金辰
Java作为一种新型的语言问世时间虽然很短,但它有一其独具的魅力,日益受到广大企业应用开发者的青睐,与之相关的技术也层出不穷。Sun公司力图使Java不仅仅是作为一种有生命力的
随着大数据时代的到来,数据的存储和访问不再囿于传统的封闭环境;同时,信息安全也关乎国家安全、企事业利益和个人隐私。以往在封闭环境中成熟的数据安全体系,是以单个系统为
本论文的全文包括五章内容。第一章简单介绍了WebGIS的概念和发展现状,尤其是了当前WebGIS的信息安全的发展状况。第二章具体介绍了WebGIS的体系结构以及安全问题。第三章则是
目前专家系统推理机的研究分为三类:本地推理机基于本地的知识库进行推理、本地推理机基于网络知识库进行推理和网络推理机基于网络知识库进行推理.随着网络技术的发展以及信
本课题研究了基于API截获的远程实时监测技术。其中,如何实现稳定高效的数据采集、制定功能完备的应用层协议、设计健壮的服务器端软件是关键。本文论证了利用截获Windows API
神经网络作为机器学习的重要方法,在生物信息学领域中取得了广泛的应用,尤其是生物序列的模式分析中,如蛋白质的分类、启动子的识别与分类等等.神经网络也同样被应用于蛋白质