论文部分内容阅读
近年来,我国农业网站的发展非常迅速,中国农业科学院农业信息研究所针对农业专业用户研究并开发了一个农业专业搜索引擎――“农搜”,为了提高“农搜”的查准率,迫切需要设计和实现一个农业网站元数据管理信息系统,为“农搜”的页面抓取提供更准确地网站信息描述,为有效地描述、定位、保存、评估、检索农业网站奠定基础。本文首先对农业网站以及“DC”元数据进行研究与分析,初步设计了针对农业网站资源描述的元数据标准。根据该标准,考虑“农搜”的需求确定了农业网站的网站级和栏目级内容的描述方法,并在此基础上探索了有关元数据自动提取的算法。设计并实现了一个农业网站元数据管理信息系统。本文研究成果如下:1、通过参考分析国内外元数据标准(主要是DC元数据、中文元数据标准框架),结合农业网站的特点,初步设计了农业网站元数据标准。2、为了满足“农搜”的应用需求,在农业网站元数据标准的基础上,进一步做了扩展和具体化,设计了一套完整的描述和管理网站以及网站栏目的元数据项。3、结合基于HTML规则和SDD网页语义分析两种方法,分析了网站元数据管理系统所涉及的每一个元数据,初步设计了元数据自动提取的算法。4、设计并实现了一个B/S模式的农业网站元数据管理系统。