论文部分内容阅读
决策树分类器是一个重要的数据挖掘问题,在数据流上建立决策树的关键问题是如何计算内部节点的最佳分裂标准.现有的算法有的不能处理数值型的属性,有的计算代价太高.本文采用将数值型的属性值分成适当的区间,根据它们gini index值的特殊性质,确定具有最大gini index梯度的区间,因而可以快速地计算最佳分裂点,实现在流数据上快速地建立决策树.