论文部分内容阅读
随着用户数据重要性的增加,基于周期性备份的数据解决方案已不能满足用户数据保护的需要。连续数据保护技术(CDP)成为近年来数据保护领域的一大研究热点,它有效解决了周期性备份方案中数据还原必须依赖特定时间点备份的限制,对用户数据做到了任意时间点的保护。当前远程连续数据保护的研究主要面向企业级数据库应用,对个人数据的远程连续保护,由于受带宽和存储的制约,目前并没有成熟的解决方案。
本论文以联想远程连续数据保护原型系统项目为背景,旨在设计针对用户桌面数据的高效低成本远程连续数据保护方案。本文研究的重点是远程连续数据保护在低带宽下的远程数据快速同步,以及大量文件版本所带来的存储负担过重和版本管理问题。
本文的主要创新和贡献如下:
1.在连续数据保护中引入基于数据块的重复数据检测技术,设计基于数据块的连续数据保护存储方案,通过对重复数据的检测重用,减轻存储负载;
2.基于当前重复数据检测技术的研究,提出变化数据块快速定位算法,提高差异数据块的检测速度;
3.基于变化数据块快速定位算法设计带重复数据检测的同步引擎,将重复数据检测引入备份/还原的同步过程,减少同步过程中的差异数据传输量,提高远程数据同步的速度;
4.通过对Subversion系统的改造,设计实现基于块存储系统的文件版本管理;
5.基于XMPP协议和RTIG联邦模型,设计同步网络,实现多用户共享数据的版本更新与同步,满足多用户协同编辑和数据共享的需要;
6.最后,基于上述研究,实现了一套完整的远程连续数据保护方案,并开发出联想RCDP原型系统。