论文部分内容阅读
本文的研究背景是为中国生物行业的某基因企业建设生物云架构,为企业提供持续的生物信息学计算虚拟环境。该架构将客户端应用统一部署和发布在若干台服务器之上,实现了应用的统一发布并将不同的客户端进行有效隔离,有效地解决了目前客户端PC种类繁多而带来的难于管理、升级和维护困难的问题,良好地避免了由于操作系统、端口、软件开发等因素造成的应用冲突。在实际部署和实现基因生物云过程中,存在着一系列问题,主要体现在生物云对存储架构在管理、性能、可扩展性方面上提出了很高的要求,普通架构下很难达到的存储容量PB级、吞吐量GB级;如何对硬件资源、软件资源、交付模式以及收费模式处理等。针对上述问题,本文有针对性的进行了深入的研究。本文首先介绍和分析了云计算相关的技术、理论及现状,三种云计算的基本架构:以Amazon S3和EC2等为例讨论了基础设施即服务(IaaS),以Google App Engine为例讨论了平台即服务(PaaS),以Salesforce.com和Gmail为例探讨了软件即服务(SaaS)。在此基础上,详细描述云计算涉及的关键技术虚拟化的主要层次及架构。本论文对生物云涉及到的两个主要方向―云存储硬件基础架构和统一资源管理进行重点研究,主要工作包括(1)研究了云计算环境对存储系统的要求,并引出了Scale-out存储架构,详细介绍了系统架构特点;(2)详细分析了Isilon Scale-out存储的数据安全性的体系结构;(3)分析Scale-out存储架构对虚拟化的支持,说明如何简化存储管理、简化数据备份和容灾管理以及在线的容量与性能的扩展性;(4)云计算环境下,在实验室和项目现场做了性能测试,并对测试结果进行了分析;(5)对统一资源管理系统模块做了架构和硬件设计作了分析说明,对各模块的原理与作用进行了详细分解。