论文部分内容阅读
近些年来,元数据在科学研究中发挥着的日益关键的作用,科学数据元数据概括了科学数据的内容、背景、结构、内部关系和来源,对于科学数据的管理、分析、共享、集成和应用至关重要。但是同时,不同团体或组织根据自己的需求定义和开发他们的元数据标准,这些标准间相互关联,而且在某些方面有语义重叠。随着元数据标准数目、规模和复杂性的不断增加,集成利用来自多标准的元数据变得越来越困难。
本文提出了一种基于本体的元数据语义集成框架尝试着解决上述问题。在框架里我们定义了一种局部元数据标准向全局模式转换和映射的机制,使得来自不同标准的元数据能够用统一的方式来查询、访问和操作。语义网技术的大规模使用使人们认识到其在数据集成中的重要作用,因此利用了语义网技术中的本体作为元数据语义集成的全局模式。此全局本体给用户提供了一个集成访问视图,从而屏蔽了不同标准元数据间语法、结构和语义的异构性。
为了达到上述目标,设计并开发了基于语义的元数据集成系统(SeMIS),此系统的建立主要包含下面三个步骤。首先,需要和领域专家配合建立一个领域全局本体,这个本体不仅是元数据全局检索的入口,而且还是连接分布式异构元数据格式的桥梁。然后,需要将原始元数据元素映射为全局本体中的概念或属性,使用了元数据语义标注的方法显式表达了元数据的隐含语义,并和本体相关联,产生的关联规则保存在映射表中。最后,基于上一步生成的映射表,系统把对本体的查询等操作翻译成对分布式元数据的操作,系统实现了把SPARQL查询重写为对本地XML数据库XQuery查询的算法,并把查询结果重新封装返回给最终用户。
基于本体的元数据集成系统已经应用在青海湖自然保护区科研项目中,为用户提供了基于鸟类观测本体的浏览和查询功能,取得了较好的效果。