论文部分内容阅读
互联网技术的飞速进步推动了教育行业的迅猛发展,教育行业进入了网络时代。网络学习虽然为学习者提供了自由便捷的学习方式,但是其背后还有很多问题,其中通过率较低和辍学率较高是需要重点解决的难题。针对网络学习发展过程中的这些瓶颈问题,本文通过对学习者在网络学习过程中产生的大量学习行为数据进行挖掘分析,并且使用集成学习算法对学习者进行分类研究。根据学习者类型的不同实施不同的教学方案,从而为网络学习平台的高效教学提供科学依据。本文使用美国麻省理工学院和哈佛大学公开的ed X网络学习数据集进行学习者分类研究。首先对ed X数据集中的学习行为特征属性进行详细分析,通过统计分析方法得出部分结论,同时使用特征工程的部分方法对数据集进行相应处理工作,为后续构建分类模型做准备。其次在分类模型构建方面,通过对Stacking算法的理论进行细致研究,根据它的性能优势将其作为学习者类别预测算法,并根据其自身特点对其在层次结构、数据特征属性表示、结合策略、分类算法等方面进行改进,将改进后的Stacking算法用于分类模型的构建。最终通过使用15个不同类型的UCI数据集对改进后的Stacking算法进行实验,结果表明改进后的Stacking算法在准确率、查准率及1值等评估指标上均有较好表现,并且使用改进后的Stacking算法与未改进的Stacking算法对ed X网络学习平台的公开数据集进行分类预测,实验结果表明改进后得到Stacking算法在ed X数据集上准确率、查准率及1值分别提升了2.46%、2.11%、1.97%,从而验证了改进的Stacking算法对网络学习者分类的实际有效性。