论文部分内容阅读
粗糙集理论是波兰数学家Z. Pawlak于1982年提出的一种处理不确定和不精确数据的理论,其主要思想是在保持分类能力不变的前提下,通过知识约简导出问题的决策或分类规则。它与其它处理不确定性问题理论的最显著区别是它无需提供问题所需处理的数据集合之外的任何先验信息,所以对问题的不确定性的描述或处理比较客观,与其它处理不确定性问题的理论有很强的互补性。 目前,关于粗糙集的研究大多数都集中在相容决策系统中,但现实中存在着大量不相容决策信息系统,针对该类系统的约简研究,将更具实践意义。为了能够较为有效获得不相容决策表较优属性约简,本文在对文献[28]中属性约简算法分析的基础上,根据不相容决策表约简不改变正域的原则,仅考虑相对差异比较表中与正域相关的实例对,同时定义了一种新的属性重要性作为特征选取的启发式信息。提出了一种改进的属性约简算法,该算法不仅适用于相容决策表,也适用于不相容决策表。该算法的完整的实例演示表明该算法是有效的。 其次,考虑到属性约简之后,虽然决策表已经得到了简化,但此时决策规则中仍存在着冗余信息。传统的决策规则约简是利用决策逻辑分别消去每一条决策规则中的冗余属性,本文在不一致决策表中,将相容和不相容对象分开,定义了一种新的属性重要性,克服了区分矩阵法时间复杂度随系统大小增加而指数增长的缺陷,给出了一种简单的直接求取决策规则核以及决策规则约简的算法,该方法同时适用于相容和不相容决策表。