论文部分内容阅读
机群并行计算技术正在成为高性能计算中的主流技术,在科学与工程计算中得到了广泛的应用,越来越多的工程技术人员需要自己编写并行计算程序并希望编写的程序正确、高效,能迅速查找到并行程序中的逻辑错误、定位性能瓶颈,提高并行计算效率。 本文研究与开发的并行计算性能实时监测与分析工具RMAPCP有助于MPI并行编程人员实现上述目标。RMAPCP实时地收集并行程序的运算过程信息和并行运算节点性能信息,以图形化方式反馈给并行编程人员,通过观察这些信息和最后的分析结果,有助于并行编程人员分析并行程序性能,查找性能瓶颈,完善并行算法,提高并行程序效率。 本文从系统运行环境、设计背景、总体设计思想、实现方法与技术等方面介绍了RMAPCP,着重探讨了性能监测库、节点机守护进程和监测前端实现中的关键技术,主要包括性能数据的采集、传输方法,实时性监测的实现,监测前端和守护进程的协调与控制,性能数据的表现与性能分析等,最后通过一个应用实例验证了RMAPCP的实际效果。