论文部分内容阅读
近年来,随着科研项目规模的不断扩大,科研领域产生的数据量急剧膨胀。这预示着科研正在步入大数据时代。大数据科研为当前的科学计算提出了一个新的挑战:处理和分析这些数据需要非常庞大的资源。为了应对这一挑战,科学家们使用了各种各样的计算技术。新兴的桌面网格因具有经济、资源潜力大等特点,日渐受到科学家们的青睐。针对现有桌面网格中的异构性所导致的应用部署成本高、资源管理复杂等问题,本文提出一个基于虚拟化技术的桌面网格架构模型并予以实现。论文主要围绕虚拟机在该桌面网格中的快速部署展开。主要的研究内容和贡献如下: 1)虚拟机部署调度策略。本文提出了面向应用的部署调度策略,该策略以“尽力合适”的方式把作业运行于合适的虚拟机之中。 2)虚拟机生命周期控制。不合理的虚拟机生命周期控制可能引起虚拟机蔓延现象的发生,从而导致资源浪费情况的出现。因此,本文在该桌面网格中定制了一套合理的虚拟机生命周期控制流程。 3)虚拟机磁盘镜像文件的管理。桌面网格一般都处于互联网环境中,具有低带宽、高延迟等特点,大尺寸虚拟机磁盘镜像文件往往会导致较大的传输和存储代价。因此,虚拟机能否被快速部署和回收在很大程度上取决于虚拟机磁盘镜像文件的管理。本文为该桌面网格中设计了一个新的虚拟机磁盘镜像文件管理系统VDIFS。该系统以志愿存储作为基本服务模式且基于分块的方式存储、发布和访问虚拟机磁盘镜像文件。在VDIFS设计的过程中,首先研究了重复数据删除技术在处理虚拟机磁盘镜像文件时的适用性,并设计了一个底层存储管理结构以管理各种数据对象。该存储结构的优点是可以支持大规模查询,查询代价不会随着底层数据规模的扩大而快速上升。其次,研究了如何能对虚拟机磁盘文件的进行快速的发布与访问。快速发布其实就是数据对象同步的一个过程。针对桌面网格资源的不稳定性以及VDIFS只要求最终一致性的特点,提出了日志驱动的数据同步方式。对于快速访问,一个很关键的问题就是对数据进行定位。论文中通过改变物理机器与物理节点环的映射方式,提出了一种新的DHT算法。该算法具有良好的查询效率,可以在O(1)的时间复杂度内实现数据定位。最后,研究了VDIFS的实际性能是否能满足实际的应用需求。 论文研究和建立的虚拟机的部署调度策略,虚拟机生命周期控制,以及虚拟机磁盘镜像文件的管理系统较好地应用在了桌面网格中。实际的应用部署证明这些技术可以很好地支持虚拟机的快速部署,从而可以有效地降低虚拟机在桌面网格中的部署代价及管理难度,为虚拟化技术在桌面网格中的研究与应用奠定了良好的基础。