信息无损数据转换的模型、测试和判定问题研究

被引量 : 0次 | 上传用户:chenliquanhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息系统中往往存在各种各样的数据形式,例如以关系型数据格式在数据库中进行存储、以XML格式在Web上进行发布和交换等。不同格式之间的数据转换是实现信息交换、信息迁移和信息共享等的一个必要手段。数据转换过程中一个基本要求是要实现信息无丢失,也即信息的无损转换。本文针对信息无损数据转换的模型、测试和判定问题进行研究。   模型方面,提出一个描述数据转换的抽象模型,该模型包括源/目标数据类型定义和数据转换函数定义。本文考虑两种信息无损:完全的和部分的。前者要求源数据中的全部信息没有丢失,后者允许用户指定源数据中的部分信息,要求这一部分信息在转换后是无损的。我们使用“数据可逆”和“相对数据可逆”的概念来分别刻画完全的和部分的信息无损。   测试问题分为两部分:数据类型定义的测试和转换函数定义的测试。针对通用模型,本文采取一种基于文法的测试方法。具体来讲,将数据类型测试转化为文法测试;相应地,利用文法的句子生成算法生成测试数据用于对转换函数的测试。文法测试方面,提出一个系统的测试框架,引入模块测试和集成测试的概念;从文法的句子识别器角度和句子生成器角度,提出两个测试活动来完成文法测试。测试数据生成方面,提出两个句子生成算法:一个基于文法的规则覆盖准则,一个基于分支覆盖准则。算法的基本思想是在满足文法覆盖准则的前提下,使得生成的句子尽量短小简单,以方便测试人员计算预期输出、执行测试和错误定位等。我们对文法测试框架和句子生成算法进行了实现和实验,验证了其有效性。   本文对关系型数据上信息无损判定问题进行了深入研究,考虑当数据转换函数和部分信息选择函数使用不同的关系查询语言表达时,问题的判定性和复杂度。首先证明出部分信息无损问题与视图确定性问题等价,在后者已有结果的基础上,推导出完全信息无损和部分信息无损不可判定的情况。除此之外,证明出下面几种情况下问题的判定性和复杂度:(1)当查询语言是Datalog时;(2)当查询语言是一元模式上的合取查询时;(3)当查询语言是由关系代数{选择,投影,乘积}操作中任意两种操作构成的合取查询子类时。本文同时对XML数据上的判定问题做了初步探索。首先,对于表达能力比较强的XML查询语言,得出不可判定的结论;其次,针对XPath的一个子类XP{/,//,(D),(*)},证明出在没有DTD限制的情况下,完全信息无损问题属于P类问题,部分信息无损问题是coNP难的,并给出该问题的一些必要条件。
其他文献
半导体分选机是集成电路半导体元器件在基板封装后切割成单个芯片,并对其进行剥离及外观分选的自动化设备。目前,国内尚无生产半导体分选设备的厂家,而且从国外引进价格昂贵、维
片上多核处理器以其效能高、设计周期短等优势成为高性能处理器设计的主流架构。相变存储器以其集成度高、漏电功耗低等优势受到多核处理器系统结构设计和研究的广泛关注。另
并行应用对计算能力的需求永无止境,推动着超级计算机在不断提高单个计算单元性能的同时不断增大系统规模。系统规模的急剧增长,造成消息通信带来的开销日益增加。以全局归约
高光谱遥感是目前遥感技术的前沿,其纳米级的光谱分辨率能够提供更加丰富的地物信息。随着高光谱遥感的在各个领域的深入研究,其广泛的应用价值备受到国内外的关注。   高光
访问控制技术是信息系统安全的重要保障,在SOA架构及云服务日渐成为主流的今天,目前基于角色的访问控制技术难以适应跨域的访问控制要求。XACML标准中提出了基于属性的基本访问
数控伺服进给系统的性能不仅直接影响着机床加工精度,也间接关乎数控加工能力能否充分发挥。传统数控伺服系统的调整常常是对单轴进行的,如响应速度、超调等方面的优化,但在
高光谱遥感是20世纪80年代兴起的新型对地观测技术。与传统遥感技术相比,高光谱遥感能够探测到更多的物质,其最大的特点是能同时获得观测区域的图像信息和光谱信息,是当前遥感领
随着新疆维吾尔自治区社会经济文化的不断发展,互联网中的维吾尔语网页信息量呈指数增长的趋势,但是与此同时,各种不良信息也同样开始大量充斥其中。因此研究和开发科学的、高效
地质勘查工作是国民经济建设的基础性与战略性保障工作,地质勘查工作质量的优劣直接关系到国家经济建设的持续、健康发展。建国以来国家各级政府及社会对地质勘查工作投入了巨
主元分析是如今在矩阵降维和数据分析用的最多的工具,目前已经在故障诊断、数据压缩、信号处理和模式识别等领域有广泛的应用。然而,传统主元分析方法在许多应用里面,却显得