学习资源采集与分类系统的设计与实现

来源 :江西财经大学 | 被引量 : 0次 | 上传用户:z362523
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术迅速发展,促使国家大力发展教育信息事业,建设数字化、智慧型校园,实现区域化学习资源深层次整合、共建、共享,使学习者和用户在海量信息中获取学习资源为零距离。通用网络爬虫是采集海量的网页信息,采集的信息内容杂乱无序、利用率低、损耗存储空间。聚焦爬虫是按一定规则采集信息,采集的资源(TXT、Word、Excel、PPT、PDF、HTML格式)内容是有序和高质。由于网络学习资源和建构主义理论支持,结合而成的Blended Learning方式,充分调动学习者和用户的积极性、主动性、创造性。同时,学习资源是远程教育、移动教育、泛在学习基础性资源,且成本低、易管理的特点为人们所关注的热点。学习者、用户以及教育研究机构对信息化学习资源需求与日俱增,然互联网资源海量、分布松散,学习者和用户获取所需学习资源如大海捞针,且获取的学习资源内容近似、风格重复、创新较小、实用性较差。因此,应用学习资源主题采集模型剔除无关干扰信息;并结合KNN文本分类方法组织和管理好海量、异构、半异构、动态特点的学习资源,为学习者和用户快速、准确查询、获取以及共享学习资源。这都是学习者和用户所关注的焦点,也是学习资源采集与分类亟待研究和解决的问题。本文首先概述学习资源采集与分类的研究背景与意义,简述学习资源采集与分类的国内外研究现状及存在问题,研究分析本文涉及学习资源主题采集、分类相关性理论和关键技术,包括:学习资源涵义、类型、格式的概念界定;学习资源网页爬虫、信息提取、页面去重的技术;学习资源中文分词、特征选取、VSM模型、KNN文本分类。详细阐述学习资源采集与分类的需求分析、系统框架设计、学习资源主题采集结构设计、学习资源分类结构设计、系统功能设计,详细阐述学习资源采集与分类的各模块实现。最后,通过实验验证学习资源采集模型和分类算法,系统评测根据其准确率、查全率、F值并分析分类结果,证实学习资源采集与分类系统应用效果显著。同时针对大规模学习资源采集建议应用LDA模型,进一步优化局部敏感哈希和KNN算法结合改善系统分类速度和准确性。
其他文献
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
作为煤矿安全生产工作中至关重要的内容,搞好煤矿“一通三防”工作是十分重要的。尤其是近年来,重大煤矿事故的发生源多出自于“一通三防”上,因而对于当前的煤矿企业而言,要想确
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊
2009年年底,惠普公司联手IDC集团,在中国推出了面向其全国企事业客户的环保文印奖励计划——“惠普绿色之道”2009文印环保大奖,旨在鼓励在办公打印方面率先采用环保解决方案
“我们再来看这幅画,画得不错,构图也好,就是笔墨太弱,加强用笔练习。画面整体感不好,注意疏密变化。”这是内蒙古老年大学山水中级班的课堂,任庆新老师在对学员交上来的画进
太原国际马拉松赛在取得一定成就的情况下更需要谋求完善和发展,马拉松比赛举办质量的提升关系到各个方面,但是整个赛事的运作规划处于核心地位,因此在了解太原市国际马拉松
(2009年11月16日,东京)富士施乐株式会社荣获由日本经济新闻社颁发的2009日本经济新闻社全球环境技术制造类大奖。富士施乐在中国苏州投资建立了整合资源循环系统。该项目被
rn
在新课标理念下,高中地理的教学改革应转变过去的教学思想理念,改变以往的教学模式,尽快适应新的教育模式.地理教师一定要全方位实施教学计划和任务,从地理教学课标所规定的
期刊
灵活的ATX300融入式远真解决方案可满足多种行业应用及独特的客户需求宝利通公司日前宣布推出全新且具有高度灵活性的融入式远真解决方案产品——Polycom ATX 300(Polycom Ar