Web数据挖掘在校企通里的应用

来源 :成功·教育 | 被引量 : 0次 | 上传用户：JEEFHARDY

【摘要】

：

【作者】

：

贾应炜

【出处】

：

成功·教育

【发表日期】

：

2013年4期

【关键词】

：

WEB数据挖掘源数据校企通 web data mining

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　【摘要】本文介绍了数据挖掘技术在远程教育中的应用，为了更好的实现远程教育技术，对源数据的收集、数据的预处理、数据挖掘及个性化智能学习系统做了较详尽的介绍。肯定了数据挖掘技术给我们提供了“变废为宝”、“化繁为简”、“从模糊到清晰”的巨大帮助。
　　【关键词】Web数据挖掘技术；远程教育
　　校企合作，发挥学校和企业的各自优势，共同培养社会与市场需要的人才，是大中专院校谋求自身发展、实现与市场接轨、大力提高育人质量、有针对性地为企业培养一线实用型技术人才的重要举措。校企通是让学校和企业实现即时通讯、技术实现优势互补、资源共享，以切实加强校企联系的紧密性。
　　一、校企通中的Web 挖掘技术
　　我们从更为一般的角度出发，对Web挖掘作如下定义：Web 挖掘是指从大量Web文档结构和使用的集合C中发现隐含的模式p。如果将C看作输入，p看作输出，那么Web挖掘的过程就是从输入到输出的一个映射：C→p。但是，服务器端只能记录学习者浏览过的页面的链接，不能了解页面上承载的知识点信息，所以，我们在设计网络课程的页面时应尽可能地将含有特定知识点的网页链接与课程中的知识点形成一一对应关系，也就满足了服务端记录学生在学习时掌握知识点情况的数据的要求，从而达到以知识点为导向来进行数据挖掘的策略。
　　二、Web 挖掘在校企通中的应用
　　1.源数据的收集
　　①服务器端数据的收集（Server Level Collection）。可以从Web服务器、代理服务器的Web log文件中收集数据，此部分信息是最简单和最方便的数据来源，它记录了每一次网页请求信息。Web日志文件是由一条条记录组成，一条记录记录学习者对Web页面的一次访问。Web服务器的日志记录格式如表1 所示：
　　另外，Web服务器还可以存储其它的Web使用信息，比如Cookie，以及学习者提交的查询数据。Cookie是由服务器产生的，用于记录学习者的状态或者访问路径。由于涉及到学习者的隐私问题，使用Cookie需要客户的配合。
　　②包监测技术（packet sniffing technology）。辅之于监视所有到达服务器的数据，提取其中的HTTP请求信息。此部分数据主要来自浏览者的点击流（Click stream），用于考察学习者的行为表现。
　　网络底层信息监听过滤是指监听整个网络的所有信息流量，并根据信息源主机、目标主机、服务协议端口等信息过滤掉不关心的垃圾数据，然后进行进一步的处理，如关键字的搜索等，最终将学习者感兴趣的数据发送到给定的数据接受程序，存储到数据库中进行分析统计。其工作流程如图1所示：
　　图1：网络底层信息监听过滤工作流程
　　③后台数据库里的原有数据。后台数据库存储了学习者和教学资源两个方面信息。
　　2.数据的预处理。按照现代远程教育技术标准，将后台数据库与网络日志预处理后得到的数据相匹配建立数据挖掘库，即学习者特征数据仓库。将收集到的数据进行分门别类。现代远程教育技术标准（CEL TS）中定义了学习者的子标准，即学习者模型规范（CEL TS-11），其中包含了学习者的八种必要信息：个人信息、学业信息、管理信息、关系信息、安全信息、偏好信息、绩效信息、作品集信息。依照此模型便可以将分布在不同功能模块中的信息抽取出来，然后清洗脏数据。
　　3.个性化智能学习系统。个性化智能学习系统由离线和在线两大阶段组成。在离线阶段通过数据收集、数据挖掘最终产生学习者个性化学习数据仓库，以便于学习者登录到远程教育网站进行学习时，网站服务器自动对用户进行模式识别。在线阶段，首先将当前登录用户进行模式识别以找到其合适的学习模式，然后将其个性化数据由学习者个性化数据仓库传送到推荐引擎，由推荐引擎进行学习策略的抽取，再由推荐引擎产生推荐集，通过网站服务器传递到用户浏览器推荐给用户。个性化智能学习系统中的核心模块就是推荐引擎，它的功能就是自动将用户登录后所进行的会话过程（即用户登录后产生的所有的URL请求）进行记录与分析并进行策略的抽取和学习资源的推荐。推荐引擎接受到从数据仓库中传递来的该用户的个性化数据后，要进行如下处理过程：首先将个性化数据中含有用户此次登录的会话信息进行滤除，即不向用户推荐本次登录后已经浏览过的知识；然后再将经过过滤的个性化数据生成推荐集，附加到用户当前的会话请求中去。
　　三、结束语
　　在校企通中面对快速增长的数据收集而没有强有力的工具，数据库中的数据就会形成数据坟墓。数据挖掘技术通过对数据的清理和集成、选择和变换、建立知识库和模式评估等过程将“数据坟墓”转变为金子。
　　参考文献：
　　[1]（加）Jiawei Han，Micheline Kamber.DATA MINING——concepts and techniques（第一版）.北京：机械工业出版社，2005.
　　[2]邵峰晶，于忠清.数据挖掘原理与算法（第1版）.中国水利水电出版社，2003-08.

其他文献

价值观与继续教育消费者行为意向

摘要：文章采用价值观作为影响参加继续教育进修行为的深层次因素，检验个人价值观与成年人参加继续教育进修行为意向的关联。以成年人为研究的对象，对于调查所得数据进行探索性因子分析和描述性分析，探讨有意向参加继续教育进修的成年人所重视的价值观。　　关键词：个人价值观；消费者行为意向；继续教育；市场营销　　　　一、引言　　随着世界各地教育产业化的迅速发展，办学院校正面临一个竞争变得日益剧烈的继续教育市场。

期刊

个人价值观消费者行为意向继续教育市场营销

基于苏教版教材与人教版教材的比较下高中语文审美教学策略

摘要：语文审美教育教学过程中，教师要在狠抓智育为主要目的地学科教学的前提下，施以审美的催化与灌注，把讲解与欣赏、发展智力与陶冶性灵、知识汲纳与美感享受有机地统一起来，让学生在掌握知识的同时，身心得到愉悦，情操得到陶冶，从而提高发现美、感受美和创造美的能力，取得事半功倍的教学效果。基于苏教版教材与人教版教材的比较下高中语文审美教学策略，发挥了语文教材审美的特点，更有助于我们在高中语文教学中更好地实

期刊

苏教版教材人教版教材高中语文审美教学

贫困地区实施乡村振兴战略的路径与对策

摆脱贫困是乡村振兴的基本前提。与非贫困地区相比,贫困地区的发展基础更为薄弱,城乡发展不平衡、农村发展不充分的问题更为突出,转型发展的难度更大,亟需通过乡村振兴和精准

期刊

贫困地区乡村振兴脱贫攻坚

信息技术产业与农村一二三产业融合：动力、演进与水平

推进信息技术产业与农村一二三产业融合,对促进农村产业融合发展,深化农业供给侧结构性改革,助力乡村振兴战略实施意义重大。通过信息技术产业与农村一二三产业融合动力、演

期刊

信息技术产业农村一二三产业驱动因素演进路径融合水平

农村合作经济组织社员异质性及其对资金互助影响研究综述

随农村合作经济组织蓬勃发展，一些示范性农村合作经济组织开始在社员内部开展资金互助，实现生产合作与信用合作结合，缓解农户在生产经营中的融资约束问题，助力产业发展。近年我国

期刊

社员异质性农村合作经济组织资金互助membership heterogeneity rural cooperative economic organiz

数学课堂教学要贴近生活

数学知识来源于生活，生活离不开数学，小学数学的许多概念、原理在现实生活中都能找到其原型，数学与生活是无法剥离的，我们在课堂上要联系生活实际，在习题的编拟上要贴近生活，让学生熟知、亲近、现实的生活数学走进学生视野，使之产生亲近感，变得具体而生动，诱发学生动手、动口又动脑，想办法来探求解决问题的过程，增强其学习的主动性，发展求异思维，培养实事求是的科学态度和探索、创新的精神，实现我们的数学生活化。　　

期刊

课堂教学乘除法教学情境求异思维认知结构操作能力中都创造能力中使主动求知

Web数据挖掘在校企通里的应用

其他学术论文