论文部分内容阅读
XML是W3C推荐的一种元标记语言规范,与其它交换语言相比,XML具有很好的描述能力和可扩展性。XML具有一致的语法,这使得它很容易解析。XML广泛应用于数据交换、数据集成中,它已经成为数据表示和信息交换标准语言。在各种各样的应用系统中已经产生并在继续产生着大量的XML形式的数据,对这些数据需要进行有效的存储和处理。XML数据存储和处理技术已成为当前最受关注和最有发展前景的技术之一。
目前DB2、ORACLE、SQL SERVER等主流数据库产品中都提供了XML数据存储方法和处理机制。为了适应这一发展趋势,国产关系数据库管理系统Cbase需要增加对XML数据存储和处理的支持。本文的主要工作包括以下三个方面:
(1)确定了XML数据存储和数据处理的解决方案
XML数据存储在索引文件中,数据库中存储的是指向XML文档根节点的指针,这样就避免了数据的重复存储。XML数据查询、增、删、改等操作通过类型定义函数来实现。
(2)提出了一种新的XML文档结构编码方案
本文提出了一种新的文档编码方案—基于扩展的前、后序遍历值及深度值编码方案,这种编码方案通过为以后元素节点的插入预留编码空间来减少插入新节点时整篇文档的编码次数。
(3)提出了一种XML文档路径查询解决策略
提出了XML文档路径查询的解决策略──简单路径索引。XML查询多数是路径查询,执行时需要遍历整棵文档树,效率十分低下。使用简单路径索引可以剪除冗余的分支,大大提高了路径查询的处理速度。