高维数据回归模型自变量相对重要性排秩方法的研究

来源 :宁波大学 | 被引量 : 0次 | 上传用户:wanghan0106
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:首先引入 Elastic-net回归分析方法并利用实际数据建立回归模型;其次探索 Car计分法和随机森林模型作为 Elastic-net回归模型自变量相对重要性排秩方法的可行性,并应用于实际数据估计自变量的相对重要性;再次通过bootstrap重复抽样技术在原始样本中抽取样本,用于比较和评价 Car计分法和随机森林模型在 Elastic-net回归模型自变量相对重要性排秩中的表现,并提出我们的推荐方法。  方法:本研究中 Elastic-net回归模型的建立,应用 Car计分法和随机森林模型计算 Elastic-net回归模型中自变量的相对重要性估计值等过程均通过R统计软件实现。应用 bootstrap重复抽样技术有放回地重复随机抽样,我们通过四次重复抽样(每次重复数依次为50、100、500、1000),建立四个大的bootstrap样本,分别用 Car计分法和随机森林模型计算 Elastic-net回归模型中自变量相对重要性估计值。  结果:我们建立的Elastic-net回归模型包含35个预测变量,模型R2为0.956,模型的预测表现和解释能力都较好。应用 Car计分法和随机森林模型计算 Elastic-net回归模型中自变量相对重要性的排秩结果各不相同。Car计分法在四个bootstrap样本中的自变量相对重要性排秩结果也有很大差异,每个自变量在不同样本中的重要性排秩位次在1~35之间散在发生,变化区间较大。并且随着重复抽样次数的增加,35个变量的相对重要性排秩位次均逐渐向均数18靠近。对于随机森林模型,虽然有些自变量的相对重要性排秩位次也会在小范围内波动,但是就其排秩位次的均值来看,四个bootstrap样本中自变量相对重要性的排秩结果都较为接近,并且该模型对自变量相对重要性的排秩结果较为明确。  结论:由于模型本身的理论基础不同,Car计分法和随机森林模型在Elastic-net回归模型自变量相对重要性中的排秩结果存在差异。其中 Car计分法很不稳定,其计算的自变量相对重要性排秩结果波动性太大。而随机森林模型由大量的分类树组合而成,由它计算的自变量相对重要性排秩结果非常稳定。并且它对各变量的相对重要性排秩位次十分明确,因此我们认为随机森林模型比Car计分法更适合作为 Elastic-net回归模型中自变量相对重要性的排秩方法。
其他文献
摘要:新时期科学技术的发展唤醒了人们的自觉运用信息进行日常学习和工作的意识。教育也不例外,为更好更多地培养出顺应社会形势的人才,要求教师在教学活动中要注重提升学生的综合素质,包括与时俱进的创新能力、独立思考的决断能力、实践结合理论知识的能力、巧妙借助外界条件尤其是信息技术进行终身学习的能力等。这些都要求师生要具备一定的信息素养。因此,本文结合小学语文的教学实践经验,围绕四个方面谈谈如何在教学实践中
摘要:随着时代的发展,信息技术逐渐走进小学数学课堂,并成为辅助小学教师有效教学的重要手段。运用多媒体辅助数学教学,可以激发学生求知欲望;发展学生的形象思维;增加教学内容,加大练习强度;提高学生的主体地位;还使数学课堂生活化,更贴近孩子的生活,从而提高了课堂教学效率。但多媒体技术也有诸多弊端,我们教师要活用多媒体,才能彰显数学课堂魅力。  关键词:多媒体,数学课堂,应用  随着时代的发展,信息技术逐
【摘要】在高考冲刺阶段,每一学科都步入了总复习,而高中数學作为三大基础学科之一,它的复习效率直接关系到高中生的整体学习质量。在总复习阶段,如何提高高中数学复习课的教学效率,是每一位数学教师都迫切解决的课题。本文主要通过浅述复习课对于提升学生数学能力的重要性,从而探究一系列提高高中数学复习课教学效率的措施。  【关键词】高中数学;复习课;教学效率  0.引言  一旦学生进入到高三的复习阶段,他们的知
摘要:课堂是学生获取知识的主要阵地,如何在小学数学课堂中用最短的时间教给学生最多的知识,已经成为一线教师共同关注的问题了。在本文中,笔者将结合自己的多年的教学实践和经验,从创新导课方式、改变教学方法、完善课堂提问、巩固课堂评价等四个方面来谈谈打造小学数学高效课堂的途径。  关键字:小学数学 高效课堂 有效途径  打造高效的小学数学课堂不仅是教学的需要更是发展学生能力的需要。为了让学生们小学数学的课