论文部分内容阅读
超大规模计算机除被应用于面向科学计算的高性能计算机,还用于面向云计算的数据中心。然而二者的传统架构都存在I/O资源绑定现象,造成I/O设备冗余,成本上升,利用率低等一系列问题。 为解决在高性能计算机和云计算数据中心共同存在的I/O资源绑定问题,中国科学院计算技术研究所提出了用于高效能互连的cHPP(configurable Hyper ParallelProcessing)体系结构,可有效融合高性能计算和云计算对I/O资源共享的需求。cHPP控制器可实现多个X86处理器和SRIOV设备之间的高效互连,并组成一个资源池节点,同时各资源池节点可通过cHPP控制器使用PCIe总线互连成直接网络,从而形成分布式I/O资源池。 本文在cHPP体系结构背景下,对分布式资源池I/O共享关键技术开展研究。在总结国内外资源池体系结构的基础上,提出一种基于PCIe SRIOV(Single Root I/OVirtualization,单根I/O虚拟化)协议的分布式多根I/O资源池结构,并给出设计及解决方案。论文的主要工作和贡献如下: (1)总结了当今I/O资源池体系结构的设计,提出了在cHPP体系结构下对分布式资源池I/O共享的设计目标,即I/O设备发现和配置的兼容性、本地资源池和分布式资源池内I/O设备的可共享性、公平性。 (2)针对设计目标,给出涉及到的三个关键技术及实现方案:直接I/O虚拟化,在完全兼容现有软硬件协议下,使用硬件模拟,建立物理I/O设备功能的逻辑镜像;直接I/O重映射,实现设备功能在从属根节点PCIe域和主控制根节点之间的ID映射和地址映射;分布式路由信息生成,将当前PCIe数据包路由到远端对应物理I/O设备或根节点。 (3)采用Xilinx Virtex6 ff365t FPGA实现了单资源池系统的原型系统,完成了单资源池系统的全功能验证和带宽性能测试;针对分布式资源池系统完成了RTL验证平台仿真测试。