论文部分内容阅读
XML正迅速取代HTML成为Web上数据表示、集成和交换的标准。与HTML相比,XML具有简单、自我描述的特点,并且实现了内容、结构和表现三者的分离,更适合于数据表示和交换。近来,XML在各种领域得到了广泛的使用,Web上涌现了海量的XML数据。为了有效地加工、分析和处理XML数据,研究者们已经提出了各种XML的查询语言和存储管理技术。在存储管理XML的各种可能的方式中,基于关系的XML数据处理是一种可行而有前景的方式,受到了广泛的关注。XML数据库系统大多运用于基于网络的查询系统,并且更新速度非常快,数据量非常大,因此,查询性能显得非常重要。用户对于其所提交的查询,总是希望检索时间越短越好。但是现有模型映射技术所生成的关系模式规范化程度比较高,一般为3NF或BCNF,对于需要进行频繁查询操作的系统来说,规范化程度高未必是一件好事,关系模式规范化的程度越高,产生的关系越多,而XML文档可能会被分解到数据库中的不同关系表中,在进行查询时会进行频繁的连结操作,导致系统性能降低。并且现有模型映射技术在映射过程中只考虑了模式文件中的结构和内容信息,忽视了其中所蕴含的语义约束,如键、函数依赖等。这些约束对于数据完整性、查询优化和数据集成等都具有非常重要的作用。本文主要研究基于关系数据库的XML数据的存储技术,对XML数据的存储模式进行优化调整,以提高查询效率。在对国内外研究现状进行综合分析的基础上,从一个全新的角度对XML数据的存储问题进行了研究,提出了从XML模式到关系模式的映射方法,PFD方法,该映射方法所生成关系模式既保持了XML模式的结构信息,也保持了XML模式上蕴含的函数依赖,同时弱化了规范化的程度,生成的关系模式符合2NF的定义,在进行查询时减少了连接的数量,提高了查询的效率。