关联规则的研究及其在高校课程设置中的应用

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:yijianlou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会信息化进程的加快,大量的数据逐渐被累积下来,为了从这些数据中发现有用的信息,数据挖掘应运而生,这十几年来人们对数据挖掘研究的热情有增无减,研究领域不断扩大,不同的挖掘分析方法不断地被提出。   本文对数据挖掘技术进行了研究分析,介绍了数据挖掘的主要方法,也给出了数据挖掘的基本过程。数据挖掘涉及了大量的准备工作与规划过程。事实上,整套的数据挖掘过程大部分时间是花费在数据前置作业阶段,其中包括数据的净化与格式转换以及表格连接。   关联规则是数据挖掘中的一个重要研究分支,本文对关联规则的概念、算法、国内外研究情况以及衡量标准等方面进行了综述。然后详细分析了经典算法Apriori算法的执行过程,指出该算法存在的缺点,针对这些缺陷,学者们已经提出了许多该算法的变形,如散列、事务压缩和划分等。在衡量标准上也加上了兴趣度和相对置信度等衡量标准。   我们经过研究分析发现,很多对于Apriori算法的更新改进都存在着解决了原来算法需要多次扫描数据库的问题,但是又在别的地方需要多花费时间,并且有的算法思想很简单,而要编程实现却很困难甚至根本无法实现。因此,本文给出了一种对原算法有所改进并且能够易于编程实现的改进方法。该算法在由K频繁项集生成K+1频繁项集的过程中,首先把K频繁项集中单个项目元素a的个数小于K的频繁项目集删除。这样就可以减少连接生成的候选集,同时也减少了剪枝的工作。我们把改进后的算法和原算法通过用MATLAB编程挖掘学生的课程成绩数据,发现改进后的算法比原算法在效率上确有提高。   虽然数据挖掘技术已经在商业、金融业等方面都得到了大量的应用,但是在学校管理中的应用却相对较少。在此,本人决定用历年来学生的课程成绩来挖掘,利用关联规则挖掘方法找出课程之间的相关性,这些挖掘结果,对我们计算机专业的课程编排工作起到了很大的指导作用,也为提高学生的学习效果提供了前提条件。
其他文献
随着网络带宽越来越大,网络应用越来越复杂,网络安全问题也日益严重。在骨干网进行安全内容检测,作为国家信息安全的重要一环变得越来越重要。骨干网的主要功能需求是及时高效的
学位
P2P是Peer-to-Peer的缩写,简单地来说,P2P就是计算机系统之间通过直接交换的方式共享资源和服务。这些资源和服务可以包括交换信息、处理器计算资源、磁盘文件存储等。在P2P的
Deep Web是指网络上众多可以在线访问的数据库,其中的数据对传统搜索引擎大部分是不可见的,它们可以通过网站提供的查询接口访问,数据量巨大。但HTML的无结构化、异质性、动
学位
在知识社会的今天,知识的建构性、社会性、情境性、复杂性和默会性得到重视,为学习提供了新的见解、方法和手段。整个社会的学习活动在资源、群体、观念、内容和环境上正在发生
学位
随着用户对审批系统动态性以及适应性要求的提高,传统的审批系统在需求变化时,调整需要付出高昂的代价,很难适应当前审批的需求。当前审批流程越来越复杂并且流程具有不确定
地理信息系统发展到现在,提出了位置智能的概念。它是从传统的GIS应用发展衍生而来的,不过其已经不仅仅局限在GIS应用上。   文章首先介绍了与位置智能相关的技术和理论,对其
随着信息技术和数据库技术的迅猛发展,人们可以非常方便地获取和存储大量的数据。如何从大量的数据中快速提取有用的和感兴趣的信息,成为海量信息处理面临的瓶颈。聚类分析技
随着网络技术的飞速发展,一种新型的以流形式存在于分布式网络中的数据模型——数据流,引起人们越来越多的关注。近些年来,数据流已广泛应用于传感器网络、金融数据分析、网络数
材料是人类社会赖以进步和发展的重要物质基础,在国民经济与人民的日常生活中扮演着不可或缺的角色。随着我国改革开放的不断深入,综合国力的不断增强,国家在材料领域的投入也日
C3I(Command,control,communication,Intelligence)信息融合技术已成为现代战争系统、工业领域和民用领域的重要支撑技术之一,数据处理技术的急剧发展也为这些领域带来了显著的进