论文部分内容阅读
网络化操作系统(云平台)能够为应用的开发、部署、管理、运营提供支持。分布式存储是云平台中的重要组成,为应用提供可扩展的数据存储。其中,非关系型(NoSQL)数据库在分布式存储的发展中独树一帜。基于NoSQL的分布式存储具有面向海量数据的高并发、高扩展、易共享等特性,这些是关系型数据库所不具备的。当前,平台中基于SQL的应用对海量业务数据的高并发读写、以及快速扩容的需求难以得到满足。为了解决这一矛盾,文章围绕NoSQL数据库的实现展开,并据此提出一种SQL到NoSQL的适配方案,将当前基于SQL的数据存储移植到NoSQL的分布式存储之上。
文章首先描述了研究背景以及国内外关于SQL与NoSQL的研究现状。在相关技术章节中介绍了云存储、NoSQL数据库及分布式文件系统的基本概念与理论。比较了SQL与NoSQL的区别,并介绍了几种流行的NoSQL数据库,其中重点介绍了NoSQL数据库的典型代表Cassandra数据库。
然后论文结合分布式存储在云平台中的位置提出了SQL应用向NoSQL数据库适配的系统需求,其中描述了功能性需求包括SQL语句解析、数据适配、操作适配、索引管理;支撑功能需求包括集群管理、用户管理、系统错误处理等。最后对系统所运行的环境做了简单的阐述。
在明确了适配系统的需求之后,论文设计了适配系统的总体架构,并在此基础上对适配系统的各个主要模块进行逐一分析。其中,针对语义解析模块和适配模块,索引模块这三个主要的功能模块进行了详细的分析。简要阐述了支撑功能模块中集群管理、用户管理、数据恢复的设计与实现方案。适配系统最终能够将数据透明地移动到NoSQL数据库中,使其能够在不改变自身结构的基础上利用NoSQL数据库的特性。
文章最后简单描述了Cassandra存储集群的实现方法,对适配系统进行功能性测试,并指出下一阶段系统需要改进与完善的地方。