结合矫正函数的决策树优化算法

来源 :计算机应用与软件 | 被引量 : 4次 | 上传用户:corydalis
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过分析ID3算法的基本原理及其多值偏向问题,结合矫正函数提出一种决策树优化算法。首先通过引进矫正函数对ID3算法进行改进,从而克服其多值偏向问题,然后运用数学中泰勒公式和麦克劳林公式的性质,对信息增益公式进行近似简化。标准数据集UCI上的实验结果表明,优化后的ID3算法不仅解决了原ID3算法的多值偏向问题,而且在构建决策树的过程中,既提高了平均分类准确率,又降低了构建决策树的复杂度,并且还缩短了决策树的生成时间。当数据集中的样本数较大时,优化后的ID3算法的效率得到了明显的提高。
其他文献
针对目前已公开的门限秘密共享方案大多是单群体门限方案的问题,引入双群体秘密共享的概念,结合多维空间解析几何和密码学理论,提出一个双群体门限秘密共享方案。其方法是引
研究了自制的马来酸酐接枝聚丙烯(PP-g-MAH)和马来酸酐、苯乙烯接枝聚丙烯(PP-g-MAH-g-St)2种增容剂对聚丙烯/聚烯烃弹性体/玻璃纤维(PP/POE/GF)复合材料力学性能的影响,利用扫描电子显
针对大尺度衰落和小尺度衰落共同作用的信道,从信息流的角度,研究离散时间加性高斯白噪声干扰场景下的信道容量与总服务量之间的关系。从理论上推导出高速铁路基站的服务量比率与基站间距的关系,为高速铁路基站的合理配置提供行之有效的方法和依据。最后,在给定服务量比率的条件下,将大尺度衰落信道基站的配置间距和增加了小尺度衰落的基站配置间距进行仿真实验对比分析。结果显示:服务量比率η<0.9时,小尺度衰落相对于大