【摘 要】
:
该文通过介绍数据挖掘理论,着重分析了目前数据挖掘中关联规则和粗集理论方面的现状和存在的问题、难点.关联规则中,Apriori算法以先验知识为基础挖掘规则,但是需要多次扫描
论文部分内容阅读
该文通过介绍数据挖掘理论,着重分析了目前数据挖掘中关联规则和粗集理论方面的现状和存在的问题、难点.关联规则中,Apriori算法以先验知识为基础挖掘规则,但是需要多次扫描数据库,时间耗费大,Fptree算法以树状结构保存交易关系信息,减少了时间复杂度,但增加了维护树的额外操作,作者提出了使用二进制、图等方法进行规则提取,给出了BFptree和Bgl两种高效算法,以期更高效地挖掘关联规则,其中BFptree把Fptree中的树用二进制表示,而Bgl用二进制表示交易数据,用图来表示数据间的关系,两种新算法都只需一次扫描数据库,减少运行时间和空间;在粗集理论中,使用可辨识矩阵进行知识表化简时,算法复杂,效率不高,作者提出了用相异矩阵代替可辨识矩阵,主要方法是用0、1代表属性间的差异,抛弃了可辨识矩阵中的属性字段组合,大大减少了算法运算时间.文中通过实验实现了上述6种算法,证明了三种新的高效算法具有更优的时间和空间复杂度.
其他文献
该文针对现有搜索引擎中存在的问题,提出了一个结构新颖的搜索引擎——移动式搜索引擎,其重点在于改进了搜索机器人的工作模式.它将移动计算作为搜索机器人的工作平台,提出了
视频和图像压缩在多媒体应用这一为工业界带来新的机遇的领域中扮演了极其重要的角色.随着Internet和无线通信的发展,视频和图像编码的基本目标正在发生着改变.传统的视频和
网络安全在Internet中起着越来越重要的作用.网络安全保障的实现方法一般可分为两大类:以防火墙技术为代表的被动防卫型和建立在加密、安全认证机制上的开放型网络安全保障系
句子相似度计算是EBMT系统实现的关键,它直接关系到EBMT系统本身的翻译质量.现有的几类句子相似度计算方法中,基于词的方法虽简单、流行,但由于对句子不加任何句法结构分析,
该文针对语音识别和中文整句输入法的具体任务,对统计语言模型中的构造和一些关键技术进行了深入的研究,主要讨论了N-gram模型、N-gram改进模型的理论基础及其实现技术.具体
该文主要研究了现场总线P-NET技术的通信协议和"虚拟令牌"传输机制,得到了一些有意义的结果,同时,设计了一套P-NET应用系统.第一章序言概述了现场总线技术的历史和研究现状,
"分布式安检多媒体信息管理系统"具有重要的现实意义.我们在遵循开发原则、明确用户需求的基础上,设计出系统的总体结构,实现了其八个功能模块的硬件集成和软件编码.其中包括
当今时代是信息化的时代,将计算机通信技术与传统家用电器相结合,随着数字化与网络技术更广泛深入家庭,一种新型的电器——信息电器已经开始走进我们的生活。广义来说,信息电器已
该文首先对网络安全加密技术进行了详细分析,提出了相应的算法;接着结合电子商务分析了安全认证的机理,讨论了几种安全认证系统;最后在此基础上研究了广泛使用的电子邮件系统
首先,该文分析了人类视觉感知机理,研究了人类视觉感知与信息处理模型.给出了图象分割的一般模型和图象分割的基本过程,其中,特征提取和分类方法的选择尤为重要.并且从人类视