基于数据挖掘的课程成绩关联性研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:zhoufei123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
学生的课程成绩不仅是学生对课程学习质量的直观反映,也是衡量教学质量的重要依据。数据挖掘是从大量的、不完全的、有噪声的数据中提取隐含在其中的、人们事先不知道的、但又潜在有用的信息和知识的过程。对学生成绩及相关数据进行数据挖掘,发现学生各课程学习效果之间的关联关系并用于教学工作的指导有着重要的意义。本文在深入研究数据挖掘知识的基础上完成了对本校应用数学专业的学生课程成绩关联关系的研究。  论文详细阐述了关联规则分析模型和聚类分析模型的设计与实现及其在课程成绩关联性研究中的应用,主要内容包括:  遵循数据仓库设计的原则,在SQL Server2005中建立和课题需求的星型数据仓库student_ scoreDW。使用结构化查询语言T-SQL进行数据预处理,使其转换为数据挖掘算法所需要的格式。实现聚类分析技术中的k-means算法在数据泛化预处理中的应用。  针对fp-growth算法的不足提出了其改进算法:基于共后缀项间频繁闭项集的改进算法Cfp-growth算法使得生成关联规则的冗余量降低,基于散列技术的改进算法HCfp-growth算法使得算法的时间效率大大提高,基于事务矩阵的改进算法MCfp-growth算法使得时间效率提高的同时避免了大量的指针操作,同时避免了内存泄露。对每一个改进算法的工作原理和过程均结合实例进行了详细说明。并基于AdventureWorks数据库对其进行了算法效率的测试,且对测试结果进行了理论分析。  将改进后的算法应用到学生课程成绩关联性的研究中,对学生成绩这一关键性能指标进行数据挖掘,得出了同时满足最小支持度阀值min_sup和最小置信度阀值min conf的学生成绩关联模式,挖掘出了学生课程成绩之间的关联性和关联程度,分析了结果的指导意义:注重课程之间的有机联系、建立成绩预警机制、提供就业参考和专业内方向选择的依据。  论文还对目前数据挖掘技术研究存在的不足之处和未来的研究方向提出自己的观点。本论文所用的开发平台是微软公司的vs2010和SQL Server2005,采用结构化查询语言T-SQL实现数据仓库的建立和数据预处理,采用C++语言编程实现课程成绩关联关系的挖掘。
其他文献
作为现代社会中的主要代步工具,汽车深刻改造了人们的生活,同时也带来了很多问题,其中汽车安全是最不容忽视的.随着电子信息技术和现代控制理论在汽车产业的结合渗透,汽车安
该文重点对飞机图像的预处理和图像的后期处理这两部分进行了研究,该文结构如下: 首先,对输入图像进行预处理,包括对图像平滑和滤波以及对图像进行边缘检测和二值化.文中分别
微流控分析系统可以把样品引入、混和、分离甚至检测集成在同一芯片上,为最终实现分析仪器的微型化、集成化、便携化开创了广阔的前景。但样品有效检测体积的减少,增加了检测的
本文对PACS中医学图像无损压缩进行了重点的研究,设计了一种基于可逆整数小波变换的DICOM图像无损压缩算法,该算法将可逆整数小波变换和自适应算术编码相结合,通过对整数小波变
分段线性系统(piecewise linear systems, PLS)能利用线性系统中各种成熟的结论对非线性系统和不确定系统进行分析和设计,在控制理论界和工程界都得到了广泛地研究和应用。对
国民经济建设的实践证明泵站在广泛的应用领域发挥着重要的作用,今后,随着国民经济的进一步发展,必将有更多的泵站兴建。研究泵站如何发挥最大的效益高效的运行是很有意义的。
非线性控制系统是当今最活跃的一个研究领域,但仍缺少系统的和有效的处理方法。模糊控制技术具有控制器设计简便、适用于许多非线性系统等特点,20世纪80年代以来在控制理论和工
对于军事、金融等提供关键敏感服务的计算机网络,安全性是其主要指标之一。目前,网络中急剧增加的服务以及新技术的采用,一方面满足应用的需求,但同时也增加了出现安全漏洞和
风能是一种取之不尽、用之不竭的清洁可替代能源,由于风力发电已经成为目前最具规模化开发和商业化发展前景的新能源发电技术,风能也就成为了全球发展最快的可再生能源。并网运行的风力发电由于可以得到大电网的补偿和支撑,成为风力发电的主流。双馈式风力发电机具有变速运行、有功无功可解耦控制、降低机械应力和噪声、提高电能质量、转差功率小(约为额定值的30%)等优点,现在已经成为工业应用最广泛的变速恒频风力发电机型
随着生物科学技术的不断发展,快速诊断试纸也得到了快速的发展,其应用领域也越来越广泛,涵盖了医疗诊断、环境检测、食品安全等各个领域。随着快速诊断测试纸技术的广泛应用,划膜