论文部分内容阅读
二十一世纪,人类社会是一个信息化社会,越来越多的人开始使用互联网并依赖网络进行学习和工作。但是,目前我国教育信息化建设尚处于初级阶段,互联网上基础教育资源的分布呈现高度分散状态,缺乏行之有效的整合标准和整合手段,用户很难方便、快捷地获取所需资源。基础教育网站黄页系统是一个自动生成基础教育网站黄页目录并以此为基础为用户提供一系列服务的系统。它通过快速收集网络上的基础教育资源,并自动化地对其进行高质量的分类和信息抽取,形成基础教育网站黄页,为用户提供浏览、检索等服务。本文统计分析了大量基础教育网站,并就所涉及到的网站分类、网站信息抽取等关键技术进行了深入的研究,在基础上设计并开发了一个基础教育网站黄页系统,以帮助广大基础教育用户实现基础教育网络资源的极大共享。主要工作可以概括为以下几个方面:(1)提出了一种渐进式网站分类技术本文在研究现有网站分类技术的基础上,结合对大量基础教育网站标题、导航、内容的统计分析,提出了一种渐进式网站分类技术,即渐进地利用网站标题、网站导航、网站文本进行网站分类,实验证明该方法既能有效地识别网站主题,达到了较高的准确率和查全率,同时也提高了分类效率。(2)提出了一种适合基础教育领域的网站元数据信息抽取技术基础教育网站元数据信息的抽取主要包括:基于规则的网站学科、学段、作者、邮编、电话、地址等信息的抽取和基于基础教育特征库的网站自动摘要技术,网站摘要包括导航摘要和文本摘要。(3)设计并开发了一个基础教育网站黄页系统文本在研究系统涉及的关键技术基础上,设计并开发了一个基础教育网站黄页系统,系统主要包括资源采集、自动标引、管理维护、用户服务等模块。它对遍布各地的基础教育网络资源进行了快速的收集和高质量的分类,并将已分类的基础教育网站按类别呈现,供用户浏览、检索;同时,提供了网站的学科、学段、作者、地址、摘要等信息,有助于用户快速判断资源的有效性。最后,对本文的研究工作进行了总结,并展望了下一步工作。