远程连续数据保护方案

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:f281124698
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着用户数据重要性的增加,基于周期性备份的数据解决方案已不能满足用户数据保护的需要。连续数据保护技术(CDP)成为近年来数据保护领域的一大研究热点,它有效解决了周期性备份方案中数据还原必须依赖特定时间点备份的限制,对用户数据做到了任意时间点的保护。当前远程连续数据保护的研究主要面向企业级数据库应用,对个人数据的远程连续保护,由于受带宽和存储的制约,目前并没有成熟的解决方案。   本论文以联想远程连续数据保护原型系统项目为背景,旨在设计针对用户桌面数据的高效低成本远程连续数据保护方案。本文研究的重点是远程连续数据保护在低带宽下的远程数据快速同步,以及大量文件版本所带来的存储负担过重和版本管理问题。   本文的主要创新和贡献如下:   1.在连续数据保护中引入基于数据块的重复数据检测技术,设计基于数据块的连续数据保护存储方案,通过对重复数据的检测重用,减轻存储负载;   2.基于当前重复数据检测技术的研究,提出变化数据块快速定位算法,提高差异数据块的检测速度;   3.基于变化数据块快速定位算法设计带重复数据检测的同步引擎,将重复数据检测引入备份/还原的同步过程,减少同步过程中的差异数据传输量,提高远程数据同步的速度;   4.通过对Subversion系统的改造,设计实现基于块存储系统的文件版本管理;   5.基于XMPP协议和RTIG联邦模型,设计同步网络,实现多用户共享数据的版本更新与同步,满足多用户协同编辑和数据共享的需要;   6.最后,基于上述研究,实现了一套完整的远程连续数据保护方案,并开发出联想RCDP原型系统。
其他文献
继续表示程序在某个执行状态下的剩余计算抽象。继续在计算机科学的各个分支中都有重要的应用。本文讨论继续在程序设计语言中的理论与应用。   继续传递风格(CPS)变换是
本文研究了计算复杂性中的几种归约方法,应用它们刻画了一些计数问题的计算复杂性,或者给出了多项式时间算法,或者证明其是#P完全的;研究了匹配线路和匹配门的性质。   多项式
随着Internet规模的扩大和网络应用的普及,网络安全问题日益突出。为了实现对敏感数据的保护,同时打破企业内部网的职能范围在物理位置上的限制,虚拟专用网(Virtual Private Net
中国的海岸线长度超过18000公里,频繁的遭受暴雨、雷暴等强对流天气的侵袭。这些自然灾害往往给社会和经济带来巨大的损失。中尺度对流系统(Mesoscale Convective System,MCS)
随着集群技术和网络技术的飞速发展,网络存储系统成为解决集群I/O性能瓶颈的主要手段之一。集群文件系统作为网络存储系统的核心技术,很好地解决了传统文件系统中存在的性能、
机群系统凭借其良好的易构建性和可扩展性,无论是在高性能科学计算领域,还是在商业计算领域,都得到了广泛的应用。但是随着机群系统硬件规模的不断扩大以及应用的复杂化,系统出现
在计算机技术发展过程中,模拟一直是一个十分重要的研究方法。模拟器是运行在一个平台上的特殊程序,它可以模拟另外一个平台所具有的特征,前者称为宿主机,后者称为目标机。模拟器
近几年来,多模移动终端得到了越来越广泛的应用。目前的研究热点是使多模终端能够同时接入多个网络,利用多种无线资源相互配合进行业务流传输。在这种通信模式下,当原有接入网络
链接预测是属性网络中常见的一类任务,即预测两个节点之间的边存在的可能性,核心在于构建有效的链接表示。传统的方法往往依靠费时费力的特征工程,但是近年来,表示学习和深度学习
在今天的开放计算环境和数据中心中,计算机系统需要根据提供服务类型的不同而划分成多个子系统进行管理和维护,各个子系统之间相互孤立,很难实现资源的共享,面对不断变化的服务需