【摘 要】
:
随机森林(random forest)模型是由Breiman和Cutler在2001年提出的一种基于分类树的算法。它通过对大量分类树的汇总提高了模型的预测精度,是取代神经网络等传统机器学习方法
论文部分内容阅读
随机森林(random forest)模型是由Breiman和Cutler在2001年提出的一种基于分类树的算法。它通过对大量分类树的汇总提高了模型的预测精度,是取代神经网络等传统机器学习方法的新的模型。随机森林的运算速度很快,在处理大数据时表现优异。随机森林不需要顾虑一般回归分析面临的多元共线性的问题,不用做变量选择。现有的随机森林软件包给出了所有变量的重要性。另外,随机森林便于计算变量的非线性作用,而且可以体现变量间的交互作用(interaction)。它对离群值也不敏感。本文通过3个案例,分别介绍了随机森林在昆虫种类的判别分析、有无数据的分析(取代逻辑斯蒂回归)和回归分析上的应用。案例的数据格式和R语言代码可为研究随机森林在分类与回归分析中的应用提供参考。
其他文献
本文旨在研究发展大多普勒条件下的移动水声通信技术,开展了四个方面的研究工作。在设计接收机时必须考虑移动水声通信中信道特性对信号带来的影响,并且根据移动水声通信信道的
<正>2010年底,国家社会科学基金重大项目"中国档案事业史"获批立项,项目的总体架构是"三史一库":"三史"即《中国档案史》《中国档案管理史》《中国档案学史》,是项目研究的主
本文旨分析电子商务现状,结合机械行业企业信息化情况,指出在经济突飞发展的今天,作为国民经济支柱产业的中国机械制造业,在国家“以信息化带动工业化,以工业化促进信息化”
随着我国初中教学课程改革的不断深入,初中地理教学作为一门基础的初中课程也随着改革的深入有着自己的创新。这一门独具趣味性及挑战性的基础学科对于中学生学习的全面发展
目的:研究腰椎间盘突出症患者行经皮椎间孔镜手术方案的临床治疗效果。方法:选取我院收治的腰椎间盘突出症患者60例作为研究对象,随机分为两组,各30例。对照组采用传统手术方
"中药超微粉体技术的相关研究"系湖南省中医药研究院承担的国家"十五"科技攻关项目,以蔡光先教授为首席科学家领衔,获得了多项国家、省部级科技成果奖,我刊为了使广大药学工
中国矿产资源总量大,但资源自然禀赋很差,经过几十年的持续攻关,我国在矿产资源综合利用领域形成了一大批具有世界领先水平的技术创新成果,我国矿产资源综合利用技术总体上处
近几年,我国新闻界屡屡出现虚假新闻事件,对社会产生了极坏的影响,这些虚假新闻的出现与新闻工作者的职业操守有着直接关系。新闻记者是媒体的喉舌,他们所提供的信息对新闻受
<正>近年来,浙江省丽水市将全市信息化统筹建设作为切入点,以信息资源最大范围、最便捷的共建共享为主要内容,以让老百姓享受到档案部门的"一站式服务、一键式检索"的便利为
激光是当代最重要的科技成就之一。本文介绍了激光产生的机理,激光的特点、激光技术的发展以及激光技术的应用与展望。