论文部分内容阅读
证据理论能够在不知道先验概率的情况下,直接表达“Uncertainty”和“Unknown”的能力,从而对不确定信息的表达和合成给出了一种很好的借鉴方法。虽然在证据完全冲突或高度冲突时,D-S合成规则就会失效或者融合结果出现不合常理的情况,但是经过国内外学者多年的研究与改进,该理论已经日趋完善。目前,它已被广泛的应用到人工智能领域。知识约简是粗糙集理论的核心内容之一,数据降维和特征提取是其主要的应用范围,在智能信息处理中有着举足轻重的地位。知识约简就是既要保持原有分类能力不变,同时还要删减冗余的属性。然而,求解决策表的最小约简是NP-hard问题。为此,通常采用启发式的方法进行知识约简。在启发式的方法中,研究比较深入的就是基于属性重要度的知识约简。但是,对于属性重要性的度量没有统一的标准,每种方法都旨在快速找到一种局部最小约简。因此,研究基于属性重要度的知识约简也是相当有必要的。本文将证据理论运用到粗糙集理论中,旨在提供一种基于证据理论的知识约简启发式算法。首先,提出一种新的证据合成方法,克服了D-S合成规则的不足;其次,利用粗糙集等价划分的概念给出属性的信息熵,并由此定义每个属性的熵值重要性;然后,基于属性的熵值重要性给出属性的概率分配值,引入二分mass函数对每个属性建立一个证据函数;接着,利用新的证据合成方法融合以上证据,并通过Pignistic概率转换得到每个属性的证据重要性;最后,通过属性的熵值重要性得到核,并以核为起点,对核以外的属性依照证据重要性进行排序,由大到小依次加入核中,直至满足约简条件。通过以上步骤就可以得到核以及知识的相对约简。实例表明,基于证据理论的属性重要度提取在分类上效果较好;同时,在知识约简中求核与相对约简的结果也是理想的。此启发式算法容易理解且易于实现,能够快速求出决策表的核和相对约简。但是,该算法只能找到知识的一个相对约简,而且此约简是否为一个最小约简有待进一步证明。