论文部分内容阅读
教育资源是网络信息资源的重要组成部分,在提高教育教学质量,挖掘教育的发展潜力方面发挥着重要的作用。但是,目前国内的教育资源建设状况却不尽人意,缺乏统一的规范和标准,处于无序、混乱的状态,造成教育资源的大量浪费和低层次的重复开发。2000 年,教育部科技司组织专家开展制定《教育资源建设技术规范》,教育资源的规范化建设逐渐成为人们研究的一个热点课题。建设教育资源的目的是为了最大限度地共享和复用,但同网络信息一样,教育资源信息的数量也是巨大的,因此,要有效利用资源库的数据资源,就必须为资源库提供方便、有效的查询检索功能。目前,中文信息处理技术、检索技术等方面的研究已得到较大的进展,出现了许多中文检索工具和检索方法。但这些检索工具和方法仍有许多不足之处。本论文致力于从规范化的教育资源库建设,资源管理系统的功能构建及实现、基于模糊相关模型的教育资源查询方法等角度来进行分析,主要包括以下工作: 1. 对教育资源的建设状况及现有的检索系统进行分析阐述了论文研究的背景及意义。分析了国内外网络教育信息标准化的研究现状,并对网络信息检索技术的研究及应用现状进行了详细地分析,最后讨论了网络信息检索技术的发展趋势。2.对规范化教育资源库进行系统构建及功能设计在系统分析《教育资源建设技术规范》的相关内容及其指导思想的基础上,提出了以规范为依托建设教育资源数据库的具体方法,并对教育资源库的功能体系进行了构建,包括资源库的查询、上载和下载模块。3.提出了一种改进的最大正向匹配法汉语的自动分词是进行中文信息处理以及中文信息检索的前提,论文对目前国内的三类分词方法进行了详细地分析研究,讨论了汉语自动分词技术的“瓶颈”问题。在分析影响机械分词法分词效果的关键因素基础上,给出了一种改进的最大正向匹配方法。该方法首先对分词的词库进行预处理,将词典中首字相同的词按照长度由大到小排列成词序列,并按照首字出现的频度对词序列进行排序,从而减小匹配的范围和次数,提高了分词速度。在算法上依据“长词优先”的原则