论文部分内容阅读
21世纪以来,人类社会全面进入信息化时代,互联网信息技术已渗透到社会的方方面面,深刻地影响着人们的生活、学习和工作方式,社会的进步和经济的发展越来越依赖互联网信息技术以及不断发展的信息资源。在教育领域,信息技术的快速发展成为提高教学质量的重要手段,使之更好地改革教学模式、途径与方法,丰富了教学资源,提高了学生学习的效率与质量。教育相关的数据量持续迅猛增加,为教师认识学生学习效果、促进教学改革等教育相关的研究提供了丰富的数据支持。学校原有的教务管理系统及在建的各种网络教学平台众多,在各平台系统的数据库中产生了大量学生学习过程的相关数据。例如,学生个人基本信息(包括学号、姓名、性别、专业、班级等),课程考试成绩(期末成绩、期中成绩、平时成绩等),课堂测试成绩,在线考试成绩,网络学习频次、网络学习时长,网络作业完成情况等等。目前这些积累的学生相关数据没有体现其应有的价值和作用。论文主要采用决策树算法中的CART算法和随机森林算法,通过分析学生的基本信息,课程考试成绩以及网络教学平台的学生学习数据及相关特征属性,使用决策树算法生成决策树,产生分类规则,从中寻找对学生成绩有重要作用的因素,形成提高教学质量的数据依据,帮助教学管理部门和教师改进教学方法和调整教学策略。通过构建学生成绩预测分类模型来具体实现,其步骤包括数据的收集准备、数据预处理(数据清理、数据转换集成)、模型构建(算法训练)和算法优化等,并实现模型的可视化结果;同时对模型相关属性的重要性进行分析,提出一些提高网络教学平台使用水平和改进教学方法的相应策略。然后对两种算法的分类性能进行了分析对比研究,研究如何提高算法的稳健性。最后利用Java设计一个原型系统——学生成绩管理预测系统,实现对学生课程考试成绩的分类预测。