论文部分内容阅读
近些年,云存储的出现对传统存储领域产生了深刻影响,是目前企业界和学术界共同关注的热点。但是目前学术界对存储的研究大都关注于带宽、安全及基础设施方面,很少放在云存储这个大环境下来考虑,尤其是对在云存储环境中面临海量数据时数据压缩技术对负载均衡的影响。另外,在对数据压缩技术进行研究时,往往通过牺牲空间来换取低时间复杂度,造成了数据在解压缩时有损。因此无法保障数据压缩前后的一致性。最后,对私有云存储系统的研究,存在着众多的开源版本,如何选取适合私有的、灵活的及可定制的云存储解决方案是我们面临的又一重大问题。针对上述问题,本文将对数据压缩技术进行分析和研究,尤其是以字典编码及其延伸出来的LZZ77算法、LZ78算法及LZW算法作为研究对象,分析了各自的优缺点,在此基础上本文提出了一种改进型LZW算法,它在负载均衡,系统扩展方面有着天然的优势。改进型LZW算法在提高算法效率和保护用户服务质量的前提下,可以将数据冗余压缩到最小,以保证尽可能少的无用信息。最后,本文在此基础上,实现了一种私有云存储平台。论文的主要内容和工作包括以下几个方面:·分析了云存储及其数据压缩技术在国内外研究现状,结合目前存在的问题,我们得出了把数据压缩技术作为研究重点的合理性和必要性。·针对数据压缩技术领域研究状况,我们提出了一种改进型LZW算法且详细分析了其性能。通过实验验证了该算法在数据压缩比、压缩时间及压缩效果方面的优越性,为以后在该领域的研究提供借鉴价值。·基于上述研究,本文针对搭建私有云存储的特点,我们实现了一个私有云存储系统MongoDB,给想要搭建私有云存储环境的用户和科研团体打下了基础。