基于XML的起源计算和起源存储研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:dfvg43g3544
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展,XML数据已成为Web上数据表示和数据交换的新标准。XML数据是半结构数据,由于其可扩展性、平台无关性、开放性等特点,在诸多领域得到了普遍应用,如科学计算、电子商务、数据集成等。然而,Web的兴起改变了数据的流动方式,数据的复制、加工和转换变得日益频繁,数据流动过程中数据的质量难以控制,这些使得人们辨别数据的可靠性变得异常困难。数据起源是描述数据产生、并随时间推移而演化的整个过程。数据起源对于数据管理具有重要意义,尤其是科学数据和高质量的Web数据管理。因此,如何追踪和管理XML数据的起源,是一个很有研究价值和应用前景的课题,也是提高Web数据质量管理的一个有益探索。本文主要的研究内容包括起源计算模型的建立、起源演算规则和起源高效存储三个方面。首先,分析已有的起源模型以及存在的问题,针对XML树型结构特征,引入一种新的标注表示结构,进而提出更一般的起源模型。然后,在本文的起源模型基础上,定义一套广义的起源演算规则和相关概念并分析了起源演算的相关性质,实现查询结果的起源表示,尤其是Where-和How-起源模型。最后,研究起源信息的高效存储,本文利用起源结构的特征,对起源信息进行去冗余处理,并将其与已有的起源存储技术进行比较分析,以及通过实验验证本文的存储技术具有很好伸缩性。
其他文献
近些年来,随着生产制造企业网络规模的不断扩大,对网络的管理变得越来越困难。加上工业网络所处的特殊的环境,很容易造成设备故障,从而给企业带来经济损失甚至是人员伤亡。如
BBS作为一种新兴的交互性强的媒体,越来越受到网民的青睐,成为了新闻、观点和民声的集散地,是网民获取信息和发表评论的重要渠道之一。BBS上的发帖和回帖都围绕一个个话题,而这些
本论文中的应用程序使用C#语言编程实现,该应用程序可以计算往返时间,并能够提供有关数据传输和连接稳定性的信息数据,这些功能对于从事网络管理的工作人员非常有用。   由于
视频运动目标跟踪是当前计算机视觉领域最活跃的研究主题,作为一门跨学科的前沿技术,它融合了图像处理、模式识别、人工智能等多种不同领域的理论知识,广泛应用于军事和民用方面
中文分词是中文信息处理领域的一项基础性课题,未登录词识别问题又是中文分词的瓶颈问题之一。为了解决中文分词中的未登录词识别效率低下的问题,本文在分析现有未登录词识别
统计机器翻译是自然语言处理领域具有挑战性的前沿课题之一,具有广泛应用价值和重要的商业应用前景。随着网络技术的发展和普及,信息量快速增加,各领域对机器翻译的需求量也
同步自动机是一种特殊的有限状态自动机,在机器人学、工业自动化以及生物计算等方面有重要应用,同步性检测和最短同步字的长度(特别是(?)ern(?)猜想)是同步自动机理论研究的两个核心
目前处理器持续增长的温度已经成为芯片设计的主要瓶颈之一。求解热方程最常用的方法是有限差分法(Finite Difference Method,简称FDM)和有限元法(Finite Element Method,简
作为当今计算机发展炙手可热的技术,并行计算及以其为基础的云计算已经成为了解决大数据量,复杂运算问题的首选方法,越来越多的应用被从单机搬到了云端。并行计算的发展使得我们
随着互联网、多媒体技术以及计算机视觉的快速发展,衍生出了大量的多媒体数据,这些数据多以图像、视频的形式呈现。一方面这些图像充斥于数字网络中给人们提供了丰富的共享资