论文部分内容阅读
随着地理信息系统的不断发展,特别是现代测绘技术和互联网技术的广泛应用,人们可使用的空间数据资源飞速膨胀,但是,目前的地理信息系统仍然是以系统为中心的,是封闭的和相对集中式的,不同系统之间相对孤立,缺乏灵活性、重用性和互操作性,另一方面,长期积累下来的各种空间信息被置于异构的GIS支撑环境中,数据资源共享困难,因而形成了信息孤岛,严重影响地理信息数据的进一步应用。网格计算(Grid Computing)技术的出现为空间数据资源的共享提供了新的思路和技术解决方案,网格计算技术与地理信息系统的结合已成为业界广泛关注的一个研究热点和技术前沿。在一个开放的、动态的网格环境下安全的共享空间数据面临着许多挑战,其中最主要的关键技术问题是网格空间资源目录的机制:也即需要设计一种实现机制,对网格环境下的分散分布的海量空间资源进行有效的管理和汇聚,实现对资源快速查询和准确定位;同时对用户和外部程序透明底层的数据分布情况,形成全局统一的资源视图,从而提高空间数据资源的共享与协同处理的能力。为了解决这些问题,本文系统的提出了网格环境下的空间资源目录的实现机制,在分析空间数据网格资源管理与汇聚框架和空间资源目录结构和设计的基础上,介绍了基于关系模型和网格服务的网格空间资源目录机制。进一步的,利用现有的MapGIS软件平台并结合Globus Toolkit V4(GT4)的网格实现,开发出网格空间资源查询原型系统(GSRSP),以验证网格空间资源目录机制对网格中空间信息资源的查询、检索功能以及对跨节点的空间计算任务解析的支持。
网格环境下的空间资源目录机制包含两个方面的内容:一是空间资源目录的结构组织、实体化存储和对外服务接口的设计;二是空间资源目录在开放的、动态的网格环境中的自适应维护机制的实现。结合网格GIS的空间资源的汇聚和管理框架,本文将网格环境下的空间资源目录分为四类关键技术:空间资源目录的组织与存储、空间资源目录服务接口、目录同步与更新机制和网格资源节点状态监控。其中,空间资源目录的组织与存储定义了网格空间资源目录的组织结构和实体化存储;空间资源目录服务接口指出了用户和外部功能模块的调用入口;目录同步与更新规定了资源目录项更新的同步策略和更新消息的实现格式;网格资源节点监控则表述了网格中资源节点的实时状态,由于网格的开放性和动态性,网格中的资源节点也可能由于各种原因(譬如服务器软硬件故障、网络状态等)而无法正常提供服务,空间资源目录必须及时发现并做出相应的调整,以保证目录的可靠性,并为跨节点空间任务的资源节点的选取提供优化支持。这四个模块是空间资源目录的支撑构件,负责协同工作完成网格环境下的空间资源查询、检索、分析和快速定位。
空间资源目录组织与存储方面,本文采用基于关系模型的目录组织方法。具体来说,将空间网格环境中的资源节点、服务、角色和空间数据等信息实体抽象为元数据,并结合网格空间资源汇聚管理框架和以数据应用为中心的空间网格应用需求,给出网格环境中各信息实体的关系模式和完整性约束,进一步地,使用关系型数据库对其进行实体化存储。
目录服务接口方面,使用符合OGSA标准的网格服务对空间资源目录的对内和对外接口进行封装,对内接口是资源目录内部的调用接口,主要是对资源目录的动态维护相关的功能封装,对外接口是空间资源目录外部模块或网格用户的访问入口,可以分为目录管理、资源注册、查询检索三类。文中给出了资源目录服务实现类的详细接口设计和实现类之间的继承关系。
同步与更新方面,本文使用基于本地消息队列的异步更新模式实现节点信息目录更新到全局资源目录的同步以及分布式全局资源目录各个副本之间的信息同步。由于网格中的节点是高度自治的,高度自治意味着网格中的任何一个资源节点都可以脱离网格中的其他资源节点单独对外提供本节点可以独立完成的网格任务;资源节点的本地信息目录必须提供该节点完整的资源目录信息,因此,资源的更新首先反映在资源节点的本地信息目录中,然后通过同步更新模块将更新同步到全局资源目录和应用域目录中。另外,为了避免全局目录服务器的单点依赖问题,网格环境中的全局资源目录也应该是分布式部署的,各目录副本之间是对等的,因此,需要一种机制,维持分布式全局资源目录副本的一致性。
网格资源状态监控通过使用驻留在资源节点上的传感器采集节点的状态信息并向所属的监控服务发送“心跳”信息,可以及时发现网格中资源节点状态的变化,并对资源目录进行相应的调整,以保证空间资源目录的实效性。另外,通过对存在冗余数据的资源节点的状态进行对比分析,可以为跨节点的空间查询任务和空间计算任务的解析和任务分发提供优化支持。
最后,本文系统的对网格环境下的空间资源目录相关模块进行了实践,并在其基础上开发了网格空间资源查询原型系统(GSRSP)。通过对GSRSP的测试验证了本文提出了网格环境下的空间资源目录机制的可行性和有效性。