一个在数据流上快速建立决策树的算法

来源 :连云港职业技术学院学报 | 被引量 : 0次 | 上传用户:xsh3310
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
决策树分类器是一个重要的数据挖掘问题,在数据流上建立决策树的关键问题是如何计算内部节点的最佳分裂标准.现有的算法有的不能处理数值型的属性,有的计算代价太高.本文采用将数值型的属性值分成适当的区间,根据它们gini index值的特殊性质,确定具有最大gini index梯度的区间,因而可以快速地计算最佳分裂点,实现在流数据上快速地建立决策树.
其他文献
区别数量扩张的传统城镇化,中国城镇化已然转向以人为本的新型城镇化道路,特色小镇作为新型城镇化建设的新形态,探究其持续性发展对当下我国经济高质量发展具有重要的现实意
缔约过失责任制度在民法中产生较晚,最早系统地提出该理论的是德国著名法学家耶林,它的理论基础为诚实信用原则。其构成要件有四条,即缔约当事人有违反先合同义务的行为;违反先合
利用国际机器人联盟和中国劳动力动态调查数据,系统考察机器人浪潮如何影响劳动力市场雇佣关系,研究发现,在机器人冲击下,劳动力市场雇佣合同显著趋于短期化,在考虑内生性等
众所周知,板式塔广泛的应用于化工、制药等行业中,作为工业生产中重要的传质与分离设备,塔板性能直接影响工业生产的能量消耗和产品质量。因此,板式塔的研究及改进一直是推动