【摘 要】
:
随着近年来智能移动设备的快速普及和移动互联网的高速发展,电子文档被越来越多的使用和传播。而在电子文档中,需要使用一种良好的数据格式来用于保存和传输数据。XML由于良
论文部分内容阅读
随着近年来智能移动设备的快速普及和移动互联网的高速发展,电子文档被越来越多的使用和传播。而在电子文档中,需要使用一种良好的数据格式来用于保存和传输数据。XML由于良好的通用性和可读性及易于被计算机处理的特性,经常被用来作为电子文档的基本数据格式。然而由于XML本身存在的缺陷,其中存在大量的数据冗余,并且,如果只要获取XML中的部分数据,仍然需要遍历整个文件,查询代价较大。目前已有很多针对XML的压缩方法,但它们都没有对电子文档中使用的XML进行特殊处理,也没有充分利用XML Schema等信息来提高压缩和查询效率。因此,一种针对电子文档的应用特点的支持查询的XML压缩方法XTrim被提出。XTrim采用Xpath作为查询语言,通过路径和先序周游XML得到先序号以及节点的关系,并基于该信息实现对Xpath中的轴和谓语等特性的查询算法。Xtrim还对一些复杂的查询算法进行优化,实验结果表明,Xtrim算法的查询效率优于其它支持查询的XML压缩方法。 本文介绍了一种基于Xtrim的高效修改方法。该方法利用Xtrim中包含的XML Schema中的信息,对XML修改的各种基本操作(例如添加和删除节点等)采用较少的数据进行纪录,并将这些修改纪录组织为独立的修改补丁。从而在修改压缩后的XML数据时,不需要将整个文件重新压缩和传输,只需要传输修改补丁。通过此补丁和原压缩数据即可得到修改后的数据。
其他文献
任务群计算(Many-Task Computing,MTC)是广泛应用于科学计算领域的一种大规模松耦合任务并行计算模式,目的是在较短的时间内完成大量资源需求相同的可独立调度任务。这种模式下
经过多年的研究与应用实践,基于relation数据库引擎扩展XML管理功能已成为共识。目前,各大商用数据管理系统DB2,ORACLE,SQL SERVER以及开源数据管理系统(MonetDB,GALAXY,xlnd
工尺谱作为一种中国古代乐谱,常用于昆剧等中国传统音乐。工尺谱拥有完整的音调、音高标记,但是节奏标记不完备,一个节拍内音符的时值划分不明确。因此,工尺谱一般都以“口传心授
观点检索任务需要为每个用户查询返回一个文档列表,要求列表中的每篇文档表达了对当前查询主题的某种观点,并依据它们对查询主题的情感程度进行排序。目前,在微博数据(比如推
随着人口信息系统应用范围的不断扩大,数据将急剧增长,简单的设施的扩容虽然能在一定时期满足人口信息系统的需求但不是长久之计。云计算的便利、经济、高可扩展性等优势吸引
Sybil账号是由恶意攻击者创建的,用来不公平的获取大量互联网资源与能力的虚假账号。长久以来,人们注意到sybil账号出现在各种互联网社区中,例如文件共享系统。但由于缺乏进
网页作为人类知识的一个重要载体,像照片一样记录了人类的历史,是人类的一份珍贵史料。同时,网页如同书籍、报纸一样,其生存周期是有限的。因此,就有许多有机构致力于有效的
非功能需求建模在软件工程领域越来越受到重视,存在着多种分析和建模方法,其中NFR Framework是一种发展迅速和应用广泛的框架。该框架的思想是用软目标来表示非功能需求,将顶层
手指静脉识别技术是近十年来新兴的生物特征识别技术。她具有防伪性好、识别率高等优点,因而具有广阔的市场前景。六年来作者所在的研究小组自主研发了手指静脉的采集设备,并