PXRDB中Xquery查询引擎的实现与优化

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:itshuai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关系数据库是企业信息系统的核心,大量的关键性商业数据都需要由关系数据库来管理。然而随着XML成为数据交换技术的非正式标准,企业在实际应用中对XML数据管理的需求越来越多。基于关系数据库的XML-Enabled方法、Native XML数据库等解决方案先后被提出,但在可用性方面均难以满足现有的数据管理需求。因此现在学术界和工业界普遍认同的一种方案是关系数据引擎和纯XML引擎并列的混合型数据库管理系统。  然而,由于技术上和工程上的复杂性,混合型数据库技术一直处于商业垄断状态。在这个背景下,国家863计划PXRDB项目启动,旨在研究关系数据和XML数据无缝结合的混合型数据管理平台。PXRDB是在PostgreSQL8.3.7基础上开发的,实现了包括子树划分的原生XML存储的自适应存储方案,倒排索引、路径索引等多种XML索引,混合数据访问的细粒度并发控制以及混合查询处理引擎。本文的研究是PXRDB项目的一部分,主要工作是XQuery引擎的实现和查询优化。  本文详细介绍了PXRDB中XQuery引擎的架构和实现方法,并且详细分析了XQuery查询处理的语法分析、静态查询分析、访问路径标注、查询计划生成等阶段的工作原理。PXRDB中实现了两类查询优化,第一类是基于启发式规则的XQuery优化,包含三个查询重写规则,主要思想是利用倒排索引、值索引、路径索引等来提高了XQuery查询在单个文档上的执行效率。然而,我们观察到这种优化对系统来说是局部的,在某些情况下,比如符合关系选择条件的元组较多时,甚至会起到负面的效果,因此我们提出并实现了混合查询的优化算法,其核心思想是将原先的标量式查询处理方法转换为集合查询处理方法。建立了代价模型对两种执行方式进行了分析。最后通过实验来评估了优化算法的性能、可扩展性及代价模型的合理性,并对PXRDB进行了XQuery功能符合性测试和TPC-C性能测试。
其他文献
随着信息技术与信息产业的飞速发展,各种各样的有线或者无线网络把人们紧密的连接在一起。无线局域网与移动通信网是目前应用最为广泛的两种无线网络。将这两种网络融合,移动运
P2P与内容分发网(Content Delivery Network)是当今网络研究的重点。P2P网络使得网络工作模式从集中式走向分布式,网络应用的核心从服务器走向每一个网络节点,从而使人们在网
福田雷沃重工 DMS系统是福田雷沃重工在实施 PLM、CAPP、用友 U8和Call Center等系统以后,为提高企业销售和服务效率,实现企业全面信息化而实施的面向企业和经销商整车销售与配
因为智能手机系统自身安全性上固有的缺陷,从而给手机病毒以可乘之机。手机病毒的发作会窃取或者损坏用户的存储于手机上的各种信息,从而给用户造成经济上或隐私上的损失。在这
本文主要探讨文档格式转换中的关键问题及其解决途径。文档格式转换时解决当前多种文档格式并存,互操作性差的一种有效途径。然而,现有的文档格式转换器的转换能力尚不理想,难以
下一代通信网络的特征之一是异构网络的融合。未来的通信网络将包含多种无线接入技术,不同的无线接入技术提供不同的覆盖范围、吞吐量和服务质量等,这些技术在性能上的互补性
软件是对现实世界中客观事物的一种反应,为了适应不断变化的现实世界中存在的实际问题,软件需要不断的更新升级。动态更新是指软件在执行期间进行的更新,在更新期间软件不会
手机越来越普及的今天,不可否认手机确实给用户带来了很多便利,它满足了用户随时随地通话的需求,但与此同时,手机也带给了用户诸多尴尬与不便。在开会时突然有来电会扰乱会场
随着无线移动通信技术日新月异的发展,通信业务已经得到了普遍的应用,极大的改善了人与人之间的交流。随着业务的普及,人们对通信业务多样性和质量的要求越来越高,要求能够随
近些年来,各行各业对数据管理系统的需求与日俱增,开发出了大量基于C/S和B/S的数据管理系统,并被应用到实际工作中。随着系统数量不断地增多,系统规模越来越大,系统中的逻辑