论文部分内容阅读
随着Internet的飞速发展,Web的出现改变了人们习惯的处理方式,也给数据库技术提出了必须面对的重要问题:即如何有效地存储和管理Web上的数据(文档),使其既能被高效地操作和维护,又能在Internet平台上方便地表示交换。XML的核心作用体现于数据的交换与共享,利用XML的样式语言来实现数据间的转换和显示,可以满足用户的多种需求。但是XML的诸多优势并没有表现在存储上,如何更为有效地存储和管理XML数据已成为一个研究热点。将XML存储在关系数据库中,可以充分利用关系数据库成熟的数据管理技术,集成现有的大量存储在关系数据库中的商用数据。但是,关系数据库的平面关系表结构与XML的层次结构有很大差异,怎样在关系数据库中有效地存储XML文档同时又保持其结构信息和文档信息成为一个难题。
论文首先分析了目前国内外XML数据存储相关技术和工具的优缺点,研究相关的理论和技术,研究XML文档的关系化存储方法。
然后提出一种从XML Schema到关系模式的映射方法,该方法考虑了XML Schema各种组件的特点,在模式映射过程中保持了模式信息的完整性和语义约束,实现了模式转换。充分考虑了XML文档的层次性、顺序性、约束性等特点,有效存储XML文档。
接着针对XML文档的关系化存储效率问题,对XML模式的更新技术和基于XML Schema的模式匹配进行了研究,并提出相应的可行方法。
最后根据本文所提出的模式映射理论,建立了一个原型系统。该系统不依赖具体的操作系统和关系数据库平台,实验表明,处理通用XML文档具有较好的效果,支持XML Schema模式标准,应用领域比较广泛。