论文部分内容阅读
随着合成孔径雷达(Synthetic Aperture Radar,SAR)成像技术的快速发展,通过成像获得的SAR图像包含的数据信息也越来越多。对SAR图像数据进行加速处理变得十分必要,异构计算成为人们加快处理海量数据速度的一个重要方式,CPU+GPU是目前最常见的异构计算架构,GPU具有极强的计算能力,使得其在并行计算领域有着得天独厚的优势。然而,随着GPU集群的不断扩大,耗电量巨大以及散热问题逐渐显现出来,成为制约GPU做并行计算的的重要制约因素。OpenCL异构计算标准的出现,使得开发人员用C语言就可以对FPGA进行开发,而不需要学习传统的硬件描述语言,为FPGA在高性能计算领域迈进了一大步。基于FPGA+CPU的异构计算架构具有较低的功耗并且可以根据具体的需要灵活的编译硬件,在一些低功耗、高性能的领域里具有良好的应用前景。本文的主要工作如下:1.本文使用FPGA+CPU架构,对基于人类视觉注意机制的SAR图像车辆检测算法进行了优化加速。首先基于人类视觉注意机制,实现高分辨SAR图像的车辆目标检测。然后根据车辆检测的具体步骤设计OpenCL内核程序,充分的利用基于FPGA的OpenCL开发的访存优化、循环展开、向量化、流水线复制和数据传输优化等各种方法对内核函数进行优化,加快了算法在FPGA平台的执行速度,提高了系统的资源利用率。最后与基于CPU平台执行车辆检测算法的性能做了对比,基于FPGA异构计算平台具有更快的执行速度和更低的能量消耗,且具有与CPU平台相近的检测结果。2.针对大尺寸的高分辨SAR图像,本文使用了加速云公司的SC-VPX系统,实现对车辆目标检测的加速。首先搭建了业务板执行OpenCL程序的平台环境,基于ZeroMQ多线程网络库,实现了SC-VPX系统的主控板与业务板的通信。然后设计了通过任务分发的方式让多块业务板同时工作的方案,实现了高分辨SAR图像车辆检测方法的加速。最后对比了大尺寸的高分辨SAR图像在DE5-Net板卡上的执行速率与在SC-VPX系统的执行速率,在SC-VPX系统上对高分辨SAR图像进行车辆检测具有更快的速度。