基于本体的科学数据库元数据语义集成系统研究与实现

来源 :中国科学院计算机网络信息中心 | 被引量 : 0次 | 上传用户:w_zhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,元数据在科学研究中发挥着的日益关键的作用,科学数据元数据概括了科学数据的内容、背景、结构、内部关系和来源,对于科学数据的管理、分析、共享、集成和应用至关重要。但是同时,不同团体或组织根据自己的需求定义和开发他们的元数据标准,这些标准间相互关联,而且在某些方面有语义重叠。随着元数据标准数目、规模和复杂性的不断增加,集成利用来自多标准的元数据变得越来越困难。   本文提出了一种基于本体的元数据语义集成框架尝试着解决上述问题。在框架里我们定义了一种局部元数据标准向全局模式转换和映射的机制,使得来自不同标准的元数据能够用统一的方式来查询、访问和操作。语义网技术的大规模使用使人们认识到其在数据集成中的重要作用,因此利用了语义网技术中的本体作为元数据语义集成的全局模式。此全局本体给用户提供了一个集成访问视图,从而屏蔽了不同标准元数据间语法、结构和语义的异构性。   为了达到上述目标,设计并开发了基于语义的元数据集成系统(SeMIS),此系统的建立主要包含下面三个步骤。首先,需要和领域专家配合建立一个领域全局本体,这个本体不仅是元数据全局检索的入口,而且还是连接分布式异构元数据格式的桥梁。然后,需要将原始元数据元素映射为全局本体中的概念或属性,使用了元数据语义标注的方法显式表达了元数据的隐含语义,并和本体相关联,产生的关联规则保存在映射表中。最后,基于上一步生成的映射表,系统把对本体的查询等操作翻译成对分布式元数据的操作,系统实现了把SPARQL查询重写为对本地XML数据库XQuery查询的算法,并把查询结果重新封装返回给最终用户。   基于本体的元数据集成系统已经应用在青海湖自然保护区科研项目中,为用户提供了基于鸟类观测本体的浏览和查询功能,取得了较好的效果。
其他文献
随着互联网技术的发展,新闻视频数据量急剧增长,但是这些网络新闻视频信息凌乱无序,有价值的信息湮没在大量冗余信息中,对其发现和管理变得越来越困难。   为更好地管理和利用
随着微电子技术的不断发展,单芯片内集成计算机系统已经成为可能,片上系统在最近十多年里得到了飞速发展。在片上系统设计中,芯片的性能、面积、功耗、可测试性、兼容性、可靠性
科学数据在科研活动中起到越来越重要的作用,科学数据的共享与服务越来越得到科研人员的重视。在科学数据共享服务中,数据安全及保护技术扮演着非常重要的角色,有力的数据保护手
禽流感是一种高致病性的禽类传染病,近几年内爆发频率越来越高。为了对疫情的可能性和潜在危险性进行风险评估,及时预测、预防疫情的蔓延,保障人民生命安全、保障畜牧业发展和保
在计算机视觉领域中,如人脸识别、视频检索等,所获得的数据往往具有较高的维数。寻找数据的低维表示即维数约简是计算机视觉研究领域中的一个核心问题。最近几年,受生物模型启发
大数据和云存储在经济生活中广泛应用,系统数据量巨大,为减少冗余数据开销并保证数据可靠性和可用性,采用纠删码取代副本已经成为业界一种趋势。数据一致性是纠删码的本质属性,保
Ad Hoc网络是一种自组织多跳无线网络,其无线信道的共享性以及多链路间的信道干扰是影响该类型网络性能的主要因素。如何有效地降低信道干扰是改善Ad Hoc网络容量的核心问题。
当前网络空间安全的整体格局是易攻难守。传统的防御方法以阻挡和检测为主要手段,具有一定的被动性和滞后性。拟态防御作为一种“改变游戏规则”的主动防御技术将对这种格局产
近年来,随着植物新品种申请量的逐渐增多,审批业务和管理工作也相应繁重起来,纯粹依赖人工受理植物新品种申请的方法已经不能满足当前形势,需要研究并开发一套“林业植物新品
今天,基于对等网络(P2P,Peer-to-Peer)的文件共享应用占据了互联网骨干网络70%的流量,已经成为互联网中最为重要的一类应用。对等网络下基于关键字的资源搜索是该类应用中的核心