论文部分内容阅读
针对不完备因素集上的分类问题,为提高分类算法的有效性,提出了一种新的多因素分类算法—差转计算.差转计算遵循了非线性分类器设计的超长方体覆盖的基本思想原理,以集合的包含关系在数据决策中的意义以及集合对称差运算在信息辨识问题中的意义为指导,通过观察比较条件因素对论域的划分能力,构建决策树的推理准则. 给出了差转计算在分类因素单一性态(离散或连续)下的算法描述与步骤.在若干UCI数据集上进行了算法的可行性分析,将结果同C4.5算法与BP神经网络算法进行比较,结果表明:差转计算的设计基本成功,在算法错误率上与C4.5算法相当,在有限次学习的条件下要远远优于BP神经网络算法;在时间复杂度上绝对地优于神经网络. 将差转计算应用于因素约简问题,在若干离散型UCI数据集上,对差转计算的约简结果同基于分辨矩阵的粗糙集约简算法的约简结果进行比较,结果表明差转计算具有良好的因素约简能力.