基于信息熵的网络课程学生分类模型研究

来源 :宁波职业技术学院学报 | 被引量 : 0次 | 上传用户:lovesnow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要: 在网络课程教学中对学生进行分类,教师能为不同类别的学生制定相应的教学策略,提高教学质量。文章将信息熵理论运用于学生分类,在预处理之后的数据上,采用ID3算法构建了基于信息增益的决策树,生成相应的决策规则,为新的输入数据提供了分类依据。
  关键词: 网络课程; 信息熵; 决策树; 信息增益
  中图分类号: TP 393 文献标志码: A 文章编号: 1671-2153(2016)05-0084-03
  0 引 言
  网络课程[1]教学是信息时代下课程新的表现形式,它以学生为主体,利用现代网络技术,为学生提供多方面的学习素材,如文档、视频等;同时也支持多种形式的师生互动,如在线答疑、讨论,使学生在任何时间任何地点都可以身临其境的学习。此外,在线测试也提供了对学生学习效果的检测。
  随着网络学习人群的增加,网络教学平台中留下了大量的数据,利用数据挖掘技术[2]可以从中获取有用的信息。登录网络教学平台学生的基础数据不同,如访问时长、论坛活跃度、学习能力等。若对学生进行分类,对不同的类别的学生采取适合其特点的教学策略,这为个性化学习、因材施教提供了可能。本文主要探讨数据挖掘技术中的信息熵[3]在学生分类模型中的应用,通过对已知样本的学习,预测未知类别学生的分类。
  1 学生分类数据挖掘流程
  学生登录网络教学平台后,留下了大量的访问数据,比如学号、访问资源、访问时长等,在这些数据中用人工的方式提取有价值的数据是一件非常困难的事,因而可以借助数据挖掘技术对数据进行分析,整体流程如图1所示。
  图1中,整个流程分为数据采集与预处理、模式发现、规则分析。原始数据中包含了大量带有噪声的和冗余的信息,这些数据的存在会对分析的结果造成干扰,所以必须对其进行过滤和清洗,并将其变成高质量的数据。在模式发现阶段,使用决策树[4]的分类算法对数据集进行分析,获得不同的分类规则,规则1、规则2…规则n,当新的学生数据进来后,根据已有的规则进行匹配,获得新数据所在的类别,即对新数据进行预测。
  2 分类模型构建与分析
  2.1 学生分类模型构建
  分类模型的构建有多种方法,本文使用ID3算法[5]进行分类的构建。构建学生的分类模型,首先要获得参与决策的相关属性,为每个属性计算信息增益[6],选择最大信息增益的属性进行划分。
  表1为学生学习记录表,从该表中可以获得影响决策的属性,如学习总时间、提问次数、资料下载次数以及测试成绩。利用聚类算法[7]对预处理后的训练数据进行聚类,得到数据集对应的分类,优、良、中、差4个类别,如表2所示。
  根据训练样本数据计算各属性的信息熵。表2中部分属性以数值的方式呈现,比如学习总时间,可以对其进行相应转换,转换规则:≥180为学习时间长,100~179学习时间中等,小于100为学习时间短。其他属性可以做同样的转换。以前10条记录为例进行分类模型构建,数据如表3所示。
  在属性“学习总时间”上的信息增益:Gain(S,A)=lnfo(S)-lnfo(S,A)=1.295-0.59=0.705位。
  同理,为剩余的每个属性计算信息增益,选择最大信息增益的属性进行划分。
  Gain(S,“提问次数”)=0.345位;Gain(S,“资料下载次数”)=0.81位;Gain(S,“作业成绩”)=0.97位。因而选择作业成绩作为决策树根节点的划分属性。而后,按照相同的方法进行递归选择,直到数据不能进一步划分为止,最终的决策树如图2所示。
  2.2 分类规则描述
  根据最终构建的决策树,可以描述相应的规则,以此作为新数据分类的依据。图2所示的决策树,规则如下:
  (1)作业成绩为A,类别为优;
  (2)作业成绩为B,类别为良;
  (3)作业成绩为C,且学习时长为短,类别为中;
  (4)作业成绩为C,学习时长为中,且提问次数为中,类别为良。
  (5)作业成绩为C,学习时长为中,且提问次数为少,类别为中。
  当有新的学生数据时,可以根据相关的规则推断学生所属的类别。比如一个新的学生数据,学习时长200 min,提问次数3次,资料下载8次,作业成绩A,根据分类得出的规则,该生的作业成绩为A,类别为优。以上结论是由例子中的10条训练数据得出的,当训练样本数据达到一定数据量,所得的规则是有意义和有价值的,可以用来预测新数据所属的类别。
  3 结束语
  网络远程教育是建立在现代信息技术平台上的一种教学模式,是传统教育的补充。随着计算机技术、网络技术等的不断发展,网络教育也逐渐展现了它的优势。将信息熵理论用于网络教学的学生分类,可以帮助教师为每个群组学生制定不同教学策略,因材施教。
  参考文献:
  [1] 李青,刘洪沛. 网络课程的设计模式[J]. 北京邮电大学学报(社会科学版),2009,11(1):96-100.   [2] SOMAN K P,SHYAM D,AJAY V. Insight into Data Mining Theory and Practice[M]. 北京:机械工业出版社,2009:4-23.
  [3] HU Q H,GUO M Z,YU D R,et al. Information entropy for ordinal classification[J]. 2010,53(6):1188-1200.
  [4] Potharst R,Bioch J C. Decision trees for ordinal classification[J]. Intell Data Anal,2000,4:97-111.
  [5] 刘红岩,陈剑,陈国青. 数据挖掘中的数据分类算法综述[J]. 清华大学学报(自然科学版),2002,42(6):727-730.
  [6] BRESLOW L A,AHA W. Dayid simplifying decision tree:a survey[J]. KnowledgeEngineering Review,1997,12(1):1-40.
  [7] 吕晓铃,谢邦昌. 数据挖掘方法与应用[M]. 北京:中国人民大学出版社,2009:77-86.
  Abstract: According to the students’ classification in the network courses teaching, teachers can make corresponding teaching strategies for different kind of students and improve teaching quality. The paper classifies students based on the information entropy theory, constructs decision tree based on information gain by using ID3 algorithm on thedata after preprocessing and generate the corresponding decision rules, which are the basis for the new input data.
  Keywords: network course; information entropy; decision tree; information gain
  (责任编辑:徐兴华)
其他文献
目的:探讨CYP2C9与VKORC1基因多态性对于个体华法林的起始给药剂量的影响,为临床个体化使用华法林提供实验依据。方法:选取某院2014年1月~2016年1月收治的232例心血管疾病患者,
采用盆栽试验,通过向土壤中添加DDT设置3个浓度处理(T1,295ng g^-1;T2,3723ng g^-1;1、3,6109ng g^-1)和1个对照(CK,31ng g^-1),研究花生(Araehis hypogaea)对DDT的吸收积累。花生果实成熟
每到假期,教育主管部门和学校为了促进教师业务学习和专业提升,总要组织长达一周或半月的业务培训和考核。但似乎教师并不领这份情,培训中教师往往学习态度消极,怨声颇多。经常会出现一些教师无故迟到或缺席,培训会场上教师随便进进出出,甚至出现领导专家在台上讲,部分教师在底下谈天说地,台上声音小、台下声音大的尴尬场面。组织者劳心竭力,耗费钱财,却落得如此吃力不讨好的结局。笔者不禁要问:假期教师培训为何会遭遇尴
目的:探讨右美托咪定复合地佐辛在髋关节置换术后自控镇痛(PCIA)中的临床效果。方法:将62例老年髋关节置换术患者随机分为观察组和对照组,其中对照组给予地佐辛0.8mg/kg+托烷
当校长难,当成功校长更难。特别在今天这样一个竞争日趋激烈的知识化、信息化、国际化的时代,当好校长难上加难。那么,今天我们怎样当好校长呢?    用“心”    校长要用心专一。做校长既是一项历史使命,更是一份社会责任。教育是事业,其意义在于奉献。投身教育事业,校长就当全心全意,专心致志,百分之百进入“角色”。千万不可心不在焉,漫不经心。用心专一是校长走向成功的第一要素。  校长要用心良苦。校长的一
目的:探讨妊娠糖尿病患者采用生物合成人胰岛素与门冬胰岛素联合治疗的效果。方法:随机将2015年1月~2018年2月入院治疗妊娠糖尿病的82例患者分为两组,甲组采用生物合成人胰岛
摘 要: 改革开放三十年,物质文化取得了巨大的进步,传统的价值观亦受到冲击,而基于现代文明的价值观尚在形成之中。今天学校里的学生,明天就是社会的公民,因此立于人类社会和谐永续发展的视角,从人类优秀文化中萃取精华作为“现代公民”的基本品质,诸如善良、诚实、自由、平等、自主、尊重、同情(爱)、公正、勇敢、智慧、勤劳、合作、创新,以及民主的精神、科学的态度,并以科学的教育方法培养之,使之在心理层面淀积现
摘 要: 通过对美国、新加坡等国推进职业教育国际化路径的梳理,发现各国在推进职业教育国际化过程中十分重视政府的主导推动作用,在职业教育国际化实施细节上,体现出课程的国际性与适用性的统一,职业技能与文化传播的合理结合,教育集团效益与国家利益的有效取舍,为我国推进职业教育国际化的顶层设计,拓展职业教育国际化市场等方面提供了借鉴。  关键词: 职业教育; 国际化; 路径  中图分类号: G710 文献标
在毛乌素沙地,其主要地貌为各种大小不一的流动沙丘、半固定沙丘和固定沙丘。沙丘高度一般在5~10m之间,大小因沙丘类型不同而不同,地形起伏不大。不同沙丘类型以及沙地微地形对沙