XML半结构数据模型及查询技术研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:ebeggar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML已经成为互联网上数据发布和数据交换的事实标准.然而由于其强大的数据表达能力,XML完全可能在互联网和数据库之间扮演更加重要的角色.它的出现将会"把Web变成数据库".将Web上的半结构数据迁移到XML上是对WWW上海量数据进行有效管理的一项十分有意义的工作.由于XML是典型的半结构化数据,关系数据库管理系统由于关系模型本身的缺陷,并不适合管理XML数据.因此,基于XML的半结构数据管理问题的研究已成为国际数据库界的一个重要研究方向之一.该文主要是针对XML半结构数据管理中的数据模型和查询等方面技术作了大量的研究工作.提出了一种新的基于XML的半结构数据模型ERA-SS和对建立在这种模型上的半结构数据的索引算法和查询重写算法.主要工作包括:1.由于XML是一种文档格式,而不是一种数据模型,因此,如何将XML的数据映象到一个具体的数据模型上是一个值得研究和探讨的问题.该文以OEM为基础,同时参照了W3C制定的关于XML的一系列规范,引入E-R图的丰富语义,提出了一种新的基于XML的半结构数据模型ERA-SS(Element-Relationship-Attribute model for SemiStructured data).2.建立索引可以有效提高XML半结构数据的查询效率,但是当源数据中大量存在不完全引用时,索引的规模会变得很大.因此我们提出一种以增量的方式建立索引的方法,能够有效地降低建立索引的代价.利用视图来对查询进行重写,使查询尽可能地在视图层完成,可以大大提高查询效率.但是目前的研究多集中在单路径正则表达式的查询,而多路径正则表达式的查询却是XML数据查询中普遍存在的.因此,我们针对多路径正则表达式的查询的特点,提出一种查询重写方案——两阶段查询重写算法,逐步缩小候选映射方案的搜索范围,降低查询重写的复杂度,从而实现查询的优化,提高查询的效率.
其他文献
应用服务器(Application Server)是分布式网络环境下,为应用提供企业资源集成、事务处理、业务组件管理和部署等基础服务的支撑平台,其技术发展十分迅速,国际上已制定了一批
图像分割是指将一幅图像划分成若干互不重叠的、有意义的和具有相同性质的区域,它是图像处理和模式识别的关键环节。在众多图像分割算法中,模糊C均值算法(Fuzzy C-Means,简称
网络的飞速发展对网络管理提出了更高的要求,因此网络管理是当前网络研究的一个重要方面。嵌入式系统作为计算机应用的一个重要领域,已深入社会的方方面面,越来越为人们所关注,是
根据生理学和心理学的知识,人类视觉系统倾向于注视那些最能刺激神经系统的视觉信号。在图像或视频中,这些视觉信号所在的区域是图像中的显著目标或视频中的运动目标。视觉注意
移动互联网中,允许主机在移动的同时保持与网络的连接,方便了用户随时随地接入互联网.但由于早期发展的网络协议都是针对固定主机的,为了使现有的网络同时支持固定主机和移动
下一代网络(Next Generation Network,NGN)的基本框架模型是将现有的公众电话交换网、移动电话网、Internet网络以及各种接入网等各种网络融合在一起,构筑以IP技术为基础的统
在传统的IP组播协议当中,每个路由器都必须为它自身所在的组播分布树保存一条组播转发状态.当网络中同时存在大量的组播进程时,路由器上所保存的相应的组播转发状态数量也会
随着中国银行贷款风险日益得到管理当局的重视,中国逐步在银行中引进推行了贷款风险五级分类制度.银行在进行贷款风险五级分类操作过程中,主要存在分类随意性大、分类结果不
随着Web服务的蓬勃发展,在众多服务中为用户进行服务的推荐和选择成为非常迫切的需求,而服务QoS是服务的推荐和选择的重要依据。本论文设计与实现了一种基于分布式网络坐标的
电子产品在人们的生活中扮演着越来越重要的作用,在工业生产中,如何提高印制电路板(PCB,Printed Circuit Board)的生产质量日益成为人们关心的话题。由于基于图像处理的印制电路板