论文部分内容阅读
XML已成为Web上数据表示、集成和交换的标准,它格式简单、自描述能力强,越来越多的应用如信息集成、电子商务等使用XML来存储、交换和发布信息。有效地存储和查询XML文档是技术发展的趋势。关系数据库是目前最成熟的数据管理方式之一,各大最新商用关系数据库都提供了高效的对XML数据处理的功能,但大量用户仍在使用早期版本数据库系统,而早期版本关系数据库对XML数据的存储和查询功能支持不力。为保护用户投资,如何使早期版本关系数据库有效管理XML文档已成为当前研究的一个热点。关系数据库处理XML数据的两个关键问题是将XML数据转换为关系模式存储以及对XML的查询转换。
本文在考察了多个模式映射策略后,选择其中较高效的扩展先序列表法来将XML文档映射为关系模式,从而解决了XML数据的存储问题。在对查询转换领域进行研究后发现,大量研究都是对XQuery的简单查询进行转换,对于XQuery的函数部分,则鲜有成熟的转换方案。在已有X-RESTOR系统的XPath-SQL查询转换原理基础上,本文提出了一个支持XQuery函数查询转换的模型。另外当前种类繁多的关系数据库产品的SQL查询语言以及内置函数有所不同,为此本文提出了一种系统架构,可支持用户根据需要选择不同的关系数据库产品,以满足系统的通用性。最后本文设计并实现了一个基于关系数据库的通用XML存储查询系统XSQS(Xml Store and Query System),该系统支持常见的关系数据库,能够将XML文档解析并存储到关系数据库中,支持对XML数据进行XQuery查询。
论文所做主要工作包括:
①选择适当的设计模式构建系统架构,满足系统的通用性。
②分析了多种模式映射策略,对其进行了优缺点的分析和比较,选择了一个较高效的模式映射方法来解析XML文档。
③分析并选择了X-RESTORE系统的XPathExpr图结构来实现XPath-SQL转换的功能。
④提出了XQuery查询变量树XQueryExpr来实现XQuery-XPath的转换。
⑤提出SQL语句生成算法,将各XPath语句生成的SQL片段组合为完整的SQL查询语句。
⑥构建原型系统,获取实验数据。