论文部分内容阅读
Internet时代,XML正在逐渐成为Web数据的标准格式。如何有效的存储和传输基于XML的数据和文档,成为当前面临的重要课题。针对此,XML数据库应运而生。当前两大基本XML数据库类型是XMLEnabledDatabase(XED,即兼容XML数据库)和NativeXMLDatabase(NXD,即原生XML数据库)。
兼容XML数据库是在传统数据库中加入支持XML存储和传输的组件,将XML文档映射到二维表之中;而原生XML数据库的基本存储单元就是XML文档本身而不是二维表。原生XML数据库在忠实XML文档,描述半结构化数据等方面比较出色。然而当前,原生XML数据库尚存很多问题有待解决,比如文档规范化,合理索引结构,数据库系统的安全性,事务处理等方面还有待提高,规范化就是其中比较重要的一个。
当前针对XML规范化,已经有了部分研究,但是这些方法在针对XML树型结构的支持上存在不足,故我们尝试提出一种新的规范化方法。
我们借鉴一些关系模式的规范化思想,并结合XML自身的树型结构特点,对XML的元素,语义做了形式化的分析,提出了包含这个概念。并在包含概念的基础上,提出了一种全新的面向XMLSCHEMA的规范化方法——XNF(XMLNORMALFORM)。
XNF的原理是基于包含语义的分析,进行XMLSCHEMA模式的分解。考虑到XML树型结构的天然属性,XNF可以消除所有的相当于关系模式中的函数依赖和多值依赖。
我们同时提出XNF的物理实现方法——面向对象方法。
我们通过实验对原生XML数据库系统的两个重要指标——数据存储性能和编程接口支持性能来对XNF进行了测试,来说明XNF的作用。