XML-Enabled数据库路径表达式查询技术的研究

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:milo999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML己成为Web上数据表示、集成和交换的标准,它的格式简单、自我描述能力强,实现了内容、结构和表现三者的分离,更适合于数据表示和交换。近年来,XML在各个领域得到了广泛的使用,Web上已经涌现了大量的XML数据。为了有效地加工、分析和处理XML数据,国内外学者已经提出了各种XML的查询语言技术。由于关系数据库是目前最成熟的一种数据管理技术,在存储和管理XML数据的各种方式中,XML-Enabled数据库查询技术显然是一种可行而有效的方式,并在学术界受到了广泛的关注。然而,由于数据模型的差异,利用关系数据库存储和查询XML数据给传统数据库技术带来了许多新的挑战。 本文对XML路径表达式的查询处理等方面进行了深入的研究和探讨,具体来说,主要工作如下: 1.以有限自动机为工具,给出了XML、XML Schema、路径表达式的自动机表示形式以及它们之间的关系。研究了在给定XML Schema的情况下路径表达式的简化算法,以及相关的路径表达式的性质,在这个过程中使用了有限自动机方法。正则路径表达式经过这个简化过程以后才能方便、高效地使用SQL/DOM来回答XML查询;把等价的简单正则路径表达式聚成一个等价类可以减少它的计算成本。 2.在查询执行过程中,对查询表达式进行分解,把复杂查询分解为多个简单查询,然后对查询中间结果进行连接。在优化设计了查询中的分解连接算法基础上,把扩展的Li-Moon编码和SuffTndex后缀树引入扩展MPMGJN算法,最后利用该算法对XML数据进行查询实验,并对结果进行了分析。 3.提出了一种新的基于路径的XML数据的关系存储方法。该方法完整无损地记录了XML文档中的各节点信息、边信息和值信息,即在关系表中存储XML文档中各元素的name、id、parentid、levelp以及所有有值元素/属性的路径,加快了查询处理的速度。 4.针对这种存储结构,提出了新的基于表连接的查询转换算法。这种方法可以将不同形式的路径表达式转化为SOL查询语句来处理。 5.构建了一个基于关系数据库存储和查询XML文档的原型系统。论文提出的存储转换和查询处理方法已在该原型系统中实现,并利用实际的XML文档对系统进行性能测试,实验证明本文的工作是可行而有效的。
其他文献
GIS技术正在受到越来越广泛的重视,已深入到各行各业。交通地理信息系统(GIS-T)领域是GIS最重要和最具增长性的应用领域之一,已广泛应用在街道和公路的管理,如进行街道和公路路
最优化理论是数学的一个分支,也是一门应用相当广泛的学科。它研究的是某些数学问题的最优解,即对给出的实际问题,从众多候选方案中找到最优方案。目前,伴随着计算机技术的高速发
面向服务的软件架构已逐渐成为软件领域的一种重要设计模式,本文所研究的是其中的一个核心问题—组合Web服务。Web服务作为当前服务的主流实现形式,得到了广泛的关注。但由于可
USB(Universal Serial Bus)接口具有众多优良特性——即插即用,支持热插拔,传输速率高(USB2.0工作在高速模式时理论上传输速率达480Mb/s),配置灵活,扩展性能好(主机可同时支持127
光谱分析检测技术和光谱分析仪器在现代科学实验、生物研究、医学及医药研究、工农业生产、国防、天文观测等领域应用极其广泛。传统的光谱仪由于存在体积火、探测速度慢、集
自80年代中期以来,数据库中涉及数据分布性、多样性、数据共享和数据理解等问题被广泛研究;许多先进的数据模型被广泛利用,如扩展关系模型、面向对象模型、对象——关系模型、演
近年来,处理器的异构多核结构成为热门的研究方向,它被广泛应用到科学计算、图形图像处理、通信等各个领域中。与传统单核处理器以及对称多核处理器相比,异构多核系统中的加速核
近年来,由于软件的复杂性不断提高以及信息系统规模不断扩大,信息技术在给社会带来深刻变革的同时,其安全问题也越来越引起人们的关注,而软件漏洞便是导致一些安全问题的重要因素
以互联网为代表的信息产业为中国带来了巨大的机会和挑战,中国社会开始进入一个以信息为核心的时代。如何快速准确随时随地地获取所关心的信息,对人们的日常工作和生活已经具有
近年来,随着互联网络应用的快速发展,人们积极参与到了电子购物和网络社交活动中,通过论坛、博客、微博、商品评论等分享自己的心情、观点和体验等。因此,互联网上产生了大量的具