论文部分内容阅读
粗糙集理论是一个有效的数据挖掘方法,正越来越被人们所重视。其主要思想是保持分类能力不变的情况下,利用等价类,通过约简,达到发掘知识并简化知识的目的。 首先,本文介绍了数据挖掘和粗糙集的基本理论和主要方法。然后研究了粗糙集理论的属性约简方法,并针对属性约简存在的问题提出了一种基于信息熵的属性约简算法,算法中引入了信息熵准则作为属性选择的标准。为满足数据库动态更新的需要,对该方法进行修改提出了一种基于信息熵的增量式属性约简。最后,给出了扩充特征矩阵的定义,提出了基于扩充特征矩阵的增量式规则提取方法。