XML模式到关系模式的映射方法研究与改进

来源 :山东大学 | 被引量 : 0次 | 上传用户:hzm_jjc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML正迅速取代HTML成为Web上数据表示、集成和交换的标准。与HTML相比,XML具有简单、自我描述的特点,并且实现了内容、结构和表现三者的分离,更适合于数据表示和交换。近来,XML在各种领域得到了广泛的使用,Web上涌现了海量的XML数据。为了有效地加工、分析和处理XML数据,研究者们已经提出了各种XML的查询语言和存储管理技术。在存储管理XML的各种可能的方式中,基于关系的XML数据处理是一种可行而有前景的方式,受到了广泛的关注。XML数据库系统大多运用于基于网络的查询系统,并且更新速度非常快,数据量非常大,因此,查询性能显得非常重要。用户对于其所提交的查询,总是希望检索时间越短越好。但是现有模型映射技术所生成的关系模式规范化程度比较高,一般为3NF或BCNF,对于需要进行频繁查询操作的系统来说,规范化程度高未必是一件好事,关系模式规范化的程度越高,产生的关系越多,而XML文档可能会被分解到数据库中的不同关系表中,在进行查询时会进行频繁的连结操作,导致系统性能降低。并且现有模型映射技术在映射过程中只考虑了模式文件中的结构和内容信息,忽视了其中所蕴含的语义约束,如键、函数依赖等。这些约束对于数据完整性、查询优化和数据集成等都具有非常重要的作用。本文主要研究基于关系数据库的XML数据的存储技术,对XML数据的存储模式进行优化调整,以提高查询效率。在对国内外研究现状进行综合分析的基础上,从一个全新的角度对XML数据的存储问题进行了研究,提出了从XML模式到关系模式的映射方法,PFD方法,该映射方法所生成关系模式既保持了XML模式的结构信息,也保持了XML模式上蕴含的函数依赖,同时弱化了规范化的程度,生成的关系模式符合2NF的定义,在进行查询时减少了连接的数量,提高了查询的效率。
其他文献
随着电信业竞争的日益激烈,电信企业竞相采取减员增效等的措施来降低运营成本。减员增效,在降低运营成本的同时,也不可避免地带来缴费网点减少、前台收费人员的不足等问题。虽然
在信息社会中,信息已经成为社会发展的重要资源,信息安全也成为21世纪国际竞争的重要战场。为了保护一个国家的政治利益和经济利益,各国政府都非常重视信息和网络安全,信息安全已
文物是古代社会生产、生活、科技、艺术等诸多信息的载体,是考古学重要研究对象之一。由于自然和人为的原因,在考古挖掘现场通常出土成千上万的文物碎片,如何从碎片快速拼接出一
经过数十年的快速发展,Internet已经发展成为足以和电信网抗衡的全球性大网,而且现有IP网络正在发生着深刻的变化,逐步由单一的数据传送网络向数据、语音、图像等实时多媒体信息
粗糙集理论是八十年代初由波兰数学家Z.Pawlak提出的一个分析数据的数学理论,粒度计算是近年来新兴的一个软计算方法。本文以当前人工智能中十分活跃的研究领域——粗糙集理
Agent和多Agent系统(Multi-Agent Systems,简称MAS)正在成为人工智能研究实用化和在分布计算环境下的软件智能化的重要技术。MAS技术的研究主要集中在三个方面:Agent行为理论、
本文对网格环境下资源预约的可适应性分析以及优化进行了研究。文章首先对资源预约问题进行了详细的表述,分别建立了一个有资源预约功能和一个没有资源预约功能的应用模型,然后
随着互联网的逐渐普及和不断发展,电子政务已经成为当前政府部门完善政府管理与服务职能的重要手段。各级国税机关很多都建立了自己的网上办税网站,为纳税人提供了方便,但还存在
企业面对日益激烈的竞争环境,为了提高自身的应变能力和竞争实力,需要应用更加高效的管理系统。业务流程管理就是为适应变化的环境,以规范化的构造端到端的卓越业务流程为中心,以
互联网是一个具有虚拟的无限潜力的信息资源。然而,这种潜力只是相对地得到充分应用,因为对于机器(计算机)来说,智能地处理和整合万维网上的这类信息是困难的。近年来,研究者们提