论文部分内容阅读
Web技术的飞速发展使得全球信息的传递和共享日益增多,而XML技术的出现则正是为了有效应对上述问题。XML已经逐渐成为Internet上数据的表示标准和交换工具,它为数据库的应用开辟了一个崭新的领域,然而由于XML数据的半结构化特性以及XML数据所特有的路径表达式查询方式不同于现有的关系数据库查询,使得关系数据库系统对XML数据的管理功能受到极大限制。 本文主要对XML数据库的查询语言、XML数据路径表达式查询的优化技术和XML数据的查询处理技术进行了重点研究。综合现有XML查询语言的特点,本文提出了一种新的XML数据库查询语言X-SQL,该语言支持XML文档中的路径表达式查询、支持XML文档的数据更新操作以及查询结果的语义描述,同时该语言具有良好的易用性。在X-SQL的基础之上,本文提出了基于路径缩短规则的路径表达式优化算法,有效地减少了路径表达式查询的长度;同时考虑到数据索引的影响,有效地降低了路径表达式的查询执行时间。本文提出了基于查询依赖树的查询处理方法并给出了查询处理各部分的算法,利用该XML数据上的查询处理方法,结合路径表达式的翻译规则,可以将用户下发的针对XML数据的X-SQL查询转化为对应的SQL执行序列并执行得到X-SQL的查询结果。最后,利用上述方法建立了XML数据库系统,并给出XML数据库系统的性能评测。