Analysis and Research on Influencing Factors and Academic Warning of Student Achievement Based on Ed

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:kency2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面向中国“2035”规划,高校和教育组织都战略性的布局智能教育,深化利用教育大数据做决策的思想,积极的尝试把教育和数据挖掘技术结合起来,用尖端的数据挖掘技术寻找有价值的信息服务老师和学生,为教学注入科学的能量。其中,学生成绩的挖掘分析在教育数据挖掘中一直是重要研究课题之一。由于学生的考试成绩是教学活动的关键环节,学生成绩的好坏反映了教与学的质量,影响着学生未来的发展路径。除此之外,在传统的教学模式下,教学过程存在许多可以提升的地方,比如说:1.传统教育模式下,教育者们常常利用“倒推法”分析学生的学习效果,即师生对教学效果的评估及改进是发生在学生课程考试之后的行为,这样的成绩分析方法在实际操作中没有达到及时纠错的效果,具有明显的滞后性。由于教育大数据技术的不断进步与从成熟,在如今的教学过程中,不仅可以利用教育大数据进行学生成绩分析,也可以利用数据挖掘技术对学生成绩进行预测。2.传统教学模式中,教师需要依靠经验和个人精力来对学生的掌握情况进行经验性的评判,然而教师不仅无法在大量学生数据中找到背后隐藏的关联,也存在精力有限的问题。以华中师范大学的《计算机基础》课程为例,单个学期的学生人数约为4000人左右,授课教师约为8人左右,这其中的师生比为1:500,因此教师无法顾及到每一个学生的学习情况,进而无法支持个性化教学。3.在目前的研究中,许多学者探讨了学生的心理和行为习惯与学生成绩之间的关系。对于学生成绩与学生所学内容的掌握情况及所学专业之间的关系探究不够深入,然而这两者的关系非常重要,利用其关系驱动教学结果优化,对于教学质量的提升来说具有重要意义。为解决传统教育的局限性,以及受到前人研究的启发。本文将数据挖掘技术应用到已有的学生成绩数据集上,构建上述问题的解决方案。实现不同类型的学生在课程学习过程中的知识掌握情况可视化、发现影响学生课程成绩的关键因素、给出阶段性学习的进步方向、辅助教师更加了解教学过程和学生反馈情况以及进一步完善精准教学。本文主要工作如下:1.构建学生画像本文在研究之初,查阅了大量的参考文献及对校内现有学情数据进行了调查。刻画出合理的学生画像,该画像由与学生考试成绩相关的特征属性构成,其中包括两部分,分别是与学习内容相关的属性和与学生基础情况相关的属性。随后对数据进行了预处理,由此确立了学生成绩分析的数据维度,构建了合理的学生画像。2.确定课程中影响学生成绩的关键因素针对学生在《计算机基础》课程中学习效果问题,利用改进的K-means聚类算法对预处理后的数据进行了聚类分析,根据聚类结果寻找影响学生成绩表现的关键因素,便于师生更全面细致的去了解自己针对课程的学习情况,找出课程中学习薄弱地方及掌握情况较好的地方,再次调整学习及教学计划,做到因材施教。由于不同数据样本对分类结果的影响程度具有差异性,引入改进的K-means聚类算法,将传统聚类中的距离公式进行修改,使得改进后的距离公式支持不同的数据样本具有不同的权重,进而提高分类的准确度。实验验证后,K-mens聚类算法可以有效给出分类结果,作为分析的依据,总结出有价值的结论。实验结果将全部数据根据聚类中心重新分到了 5个新的数据群中,分别根据每个群中学生各自的特征属性的分布情况去分析不同类型学生的学习情况及课程中主要影响学生成绩的知识点。为了清楚的看到聚类分析的结果,本文利用python中的画图工具对聚类结果进行了可视化,形成了聚类效果图和针对每一个分群的概率密度图。3.构建最佳学业预警模型为了帮助师生提前感知课程学习效果,使存在挂科风险的学生及时进行学习调整,进而提高课程通过率,帮助学生以科学的方法顺利通过课程。同时为了提升学生成绩预测模型的预测能力,本文基于文献中的主流方法做对比实验,挑选最优方案。首先根据数据集的特征,分别对决策树和回归算法两种主流方法进行改造,形成基于决策树的随机森林预测算法和基于回归算法的多元线性回归算法。其次利用两个算法中性能最佳的随机森林算法模型配合K-means聚类算法构建改进的随机森林预测模型,从而提高随机森林算法的分类能力,提高预测模型的准确率,最终改进的随机森林的预测准确率达到93.06%。采用聚类分析获取的影响课程中学生成绩关键因素的组合作为预测模型的输入,预测结果的准确性再次证明了课程中部分题目对学生总成绩的影响较大,部分课程对总成绩的影响较小,选择合适的特征组合也可以帮助预测结果的准确性得到有效提高。4.提出改进的K-means聚类算法在传统的K-means聚类算法中,数据样本的分类是基于样本X与每个初始聚类中心之间的距离,将样本划分到距离样本最近的聚类中心所在的簇中。但该判断依据缺乏考虑数据样本特征维数的权重,认为不同样本数据对分类结果的影响没有差异,从而降低了分类结果的准确性。针对上述问题,提出了一种改进的K-means聚类算法,其中改进的距离公式可以支持不同的数据样本具有不同的权值,避免出现一些对结果影响小的样本但与其他对结果影响大的样本的权重相同干扰分类结果的问题,因此使得对结果影响较大的样本具有较高的权值,从而提高算法分类结果的准确性。5.提出改进的随机森林算法针对传统随机森林算法中存在局限性,提出改进的随机森林算法。在传统的随机森林算法中,经过训练的决策树的分类性能好坏差异较大,并且决策树之间存在较高的相似度。改进的随机森林算法是基于传统的随机森林算法,考虑到随机森林中的分类功能和决策树之间的多样性,对传统随进森林模型中的决策树分类的精度进行改进,选择优质的决策树即分类质量较好的决策树,随后通过多样性评价准则去衡量决策树之间的相似度,主要利用聚类算法的原理,去将决策树分成多个群组,挑选出树与树之间的相似度较低的决策树,并将其重组成新的随机森林模型的子集,进行后续实验得到最佳结果。这样做可以提高随机森林算法的分类能力,同时缩减算法执行时间。该算法主要包括两个步骤,其一是提取高精度的决策树,主要从传统的随机森林算法中形成的决策树中提取。其二是利用聚类算法的原理对上一步中提取的高精度的决策树进行聚类,从中再提取存在差异性的即聚类后的群组相似度较低的决策树。最终达到算法结果准确性提高的目的。综上所述,本文主要基于学生多元化的学习身份数据,结合了数据预处理技术和机器学习技术构建了合理的学生特征画像,设计机器学习算法组合对学生的特征属性进行深入分析了解,随后构建预测模型实现学业预警。首先对由学生考试成绩和学生背景信息组成的多源数据进行预处理并基于属性与总成绩的关联性进行融合从而构建合理的实验数据集,设计改进的K-means聚类算法对实验数据进行深入挖掘分析,利用聚类结果的可视化展示对不同聚类分群中的学生特征进行详细分析,确定影响总成绩的关键属性。接着利用决策树和回归算法设计对比实验,实现成绩预测。为了提高预测结果的准确性,基于对比实验中表现较好的随机森林算法提出改进的随机森林预测模型,基于影响学生成绩的关键特征属性对学生成绩进行预测,在改进的随机森林算法中对传统随机森林产生的决策树进行了过滤,挑选出高质量的决策树组成高精度高多样性的子森林进行后续实验。在实验中利用准确率、召回率、F值、MSE相关数据指标评判实验结果的好坏,最后基于三个预测模型的实验结果的对比分析,选择准确率更好的模型,即基于改进的随机森林算法构建的预测模型,该模型可以辅助实现学业预警,帮助师生提前感知学业风险,做出相应合理科学的学习及教学计划的变更,提高学习及工作的效率。在研究中,有许多地方依然值得去改进,但由于本人的专业知识储备有限及时间方面的限制等原因,需要在日后的学习研究中去进一步完善。基于目前的研究进展,在我们掌握了不同学生对于知识点的学习状态,以及通过预测来提前了解可能存在的考试分数较低等学习问题后,建议建立个性化的学习资料推荐机制,有效的帮助学生补全短板,巩固学习基础,创造更佳的学习成绩。
其他文献
液晶弹性体(Liquid Crystal Elastomers,LCEs)因其大且可逆的变形、响应速率快、优异的力学性能、各向异性以及驱动条件简单灵活等特点被人们认为具有广泛的应用潜力,迅速吸引了人们的研究兴趣。然而,目前液晶弹性体的应用仍然面临着制备技术不成熟、成形技术有限以及材料变形模式简单等问题。墨水直写打印技术(Direct Ink Writing,DIW)作为一种3D打印技术,不仅仅可以
随着煤矿开采深度的增加,构造应力复杂多变,导致深部软岩巷道的围岩控制问题尤为突出。因此,研究构造应力区松软围岩巷道的变形破坏特征、围岩变形机理及围岩控制技术是非常重要的。本文以糯东煤矿构造应力区松软围岩巷道为研究对象,结合副平硐现有支护方式,利用现场调研及监测、实验室试验、理论分析、数值计算及井下工程试验相结合的方法,研究了构造应力区松软围岩巷道变形破坏规律,并基于应力控制原理,提出了构造应力区松
可靠性分配是系统可靠性设计的重要任务之一,其结果直接影响系统的设计方案。通过可靠性分配,可以从技术、时间、成本等方面分析各部分实现的难易情况,从而使系统不同层次的设计人员明确各自的设计目标,为质量控制和采取改进措施提供依据。由于复杂机械系统失效模式种类多、零部件标准化程度差和寿命分布不同,造成可靠性影响因素多、层次不一、分配难度较大的情况。复杂机械系统设计初期,可靠性分配方法较多,分配主观性太强、
极小模型的计算在人工智能推理系统中是一项必不可少的任务。然而,即使是正CNF(Conjunctive Normal Form)公式,其极小模型的计算和验证都是不易处理的。当前,计算CNF公式极小模型的主要方法之一是通过将CNF公式转换为析取逻辑程序后,用回答集程序(Answer Set Programming,ASP)求解器计算其稳定模型/回答集。针对计算CNF公式的极小模型这一问题,本文提出了几
伴随着电子设备在生活中越来越广泛的应用,电磁波污染问题不可忽视。微波吸收材料就是一类通过耗散入射电磁波,将电磁波转换成别的形式的能量。从而大幅衰减反射波能量,减少电磁污染的一类材料。我们认为,微波吸收材料需要具有轻质,低厚度,高物化稳定性,吸收频带宽,强吸收等优点。石墨烯以及二硫化钼(Mo S2)是一类具有层状二维结构新型纳米材料,拥有良好的化学稳定性以及高比表面积,是一种理想的电介质微波吸收材料
数字贸易作为智能技术和互联网络快速发展、融合的产物,对全球产业链发展至关重要,尤其是在新冠肺炎疫情下,能够提高经济韧性和抗风险能力。东北亚经济圈作为全球重要的经济增长极之一,对中国的对外贸易举足轻重。基于此,选取东北亚经济圈中的中国、日本、韩国、俄罗斯、蒙古五国2001-2020年的数据作为研究样本,用因子分析法构建测度指标体系对数字贸易进行衡量,并将其带入构建的出口随机前沿引力模型,研究结果表明
研究目的初步揭示肝脏I/R过程中线粒体和脂质成分的动态变化,研究UDCA-LPE对肝脏I/R的保护作用及其机制,为肝脏I/R的防治提供新的治疗方向。研究方法1.构建体内体外肝缺血再灌注模型,构建体外肝细胞氧化应激模型。2.通过MDA、SOD、GSH试剂盒,ROS荧光探针、线粒体ROS探针,氧化还原信号通路分子水平检测等方法分析UDCA-LPE预处理对肝I/R过程中氧化应激水平的影响。3.通过电镜,
律师在场权最初产生于美国,发展于英美法系其他国家。二战后,随着世界范围内人权保障运动的兴起,大陆法系许多国家也确立了律师在场权。作为犯罪嫌疑人的一项重要诉讼权利,律师在场权对于制约侦查权,防止违法侦查行为,实现程序公正,保障犯罪嫌疑人的程序性权利和其他合法权益都具有重要意义。由于受历史环境、司法制度和传统诉讼文化的影响,我国刑事诉讼法特别注重发挥公安机关、人民检察院、人民法院在惩罚犯罪中的职权作用
近些年,智慧教育飞速发展。2019年底爆发的全球新冠病毒肺炎疫情迫使许多学校利用线上学习平台代替传统的面对面授课模式,从而进一步加快了智慧教育发展。智慧教育是指利用计算机、网络、信息数据、多媒体和人工智能等现代信息技术促进传统教学方式的变革发展。智慧教育在应对突发事件方面及未来教育体系发展过程具有重要作用。目前,智慧教育要解决的关键问题是个性化学习问题,就是期望按照不同学生的学习特征及需求采用合适
高维数据发布共享已成为数据分析利用的重要基础,但直接发布高维数据存在隐私泄露的风险,因此在高维数据发布之前使用差分隐私保护技术进行数据隐私处理。本文针对差分隐私技术应用于高维数据隐私发布过程中,存在直接向高维数据添加噪音导致发布结果不可用、无法根据实际隐私保护需求个性化选择隐私预算分配方式、不能优化数据隐私保护强度和可用性之间的矛盾关系等问题,在已有研究的基础上提出相应的解决算法。主要内容研究如下