论文部分内容阅读
随机森林(RF)被广泛用于数据分类和回归问题,随机森林算法是Leo Breiman在2001年提出的.本文主要针对变量选择的两个经典问题进行分析.第一个是找到重要变量为解释变量,第二个是更加严格地去设计一个好的预测模型.其贡献主要是基于随机森林对变量的重要性指标提供一些见解,并且使用随机森林的重要性为解释变量的排名提出一个策略,逐步提升变量引入策略.