论文部分内容阅读
借助于信息技术的不断发展,传统的教育领域也在发生着深远的变革。计算机辅助教学(CAI,Computer Aided Instruction)正在逐渐成为一个被社会大众所关注的热门焦点。而题库系统作为重要的基础资源,进而成为了教学系统中最关键的组成部分。但是在题库系统的设计开发过程中,开发人员总是面临着两个待解决的关键问题:不同题库系统之间,如何实现题库资源的无障碍共享以及如何快速高效地批量录入试题资源,以建立题库系统的基础内容库。为了解决不同系统之间的资源流通问题,本文引入了全球通用的IMS QTI协议。该协议的产生,旨在为不同系统和用户提供具有可相互操作的统一格式的练习/测试模型,使不同资源库之间的内容集成成为可能。在文章中,通过识别分类等操作将现有的试题资源文件整理成符合QTI协议的XML文件,作为不同系统之间资源流通的媒介。针对题库批量的问题,传统方式分为两种:人工逐一输入和含人工预处理的批量导入。人工逐一输入方式需要大量的资源和人力,但效率并不高。而包含人工预处理的批量导入,通常都需要人工将试题信息整理成特定格式的文档,然后以批量的方式对其进行读取和录入操作。该方法虽然缩减了试题录入环节的时间,但还是需要依赖大量的人力对文档格式进行整理工作。为了提高题库系统的实用性,本文引入了分词算法和朴素贝叶斯分类器,改进了传统批量导入方式:将试题文本传入分词器,使用分词算法对文本内容进行有意义的词组分隔,然后将读取到待确定的关键字进行属性提取,将得到的属性序列输入朴素贝叶斯分类器对待确定的关键字进行识别分类,如果识别为特定的关键字,则对其进行特殊文本标记,如果判定为非特定关键字,则不进行标记,接着在所有的试题内容进行分类处理之后,把带有标记的文本转换成符合QTI规范的XML文件,最后整体解析并批量导入至数据库。设计中引入了分词算法、基于统计的分类器等机器学习程序,改变了传统的人工处理方式,并在实际项目中得到了验证,提高了工作效率。