论文部分内容阅读
随着计算机和网络技术应用的普及,出现了大量分散的闲置的计算机,他们的处理能力之和可以超过超级计算机。越来越多的科学家需要利用这类异构机群系统或工作站网络上开展高性能计算。异构系统的负载平衡问题是影响这种系统使用效率的重要因素。开展异构系统的动态平衡负载平衡技术的研究,开发相应的并行处理支持系统,可以大大方便科研人员使用分布式异构并行处理系统。
本文对异构分布式并行处理的负载平衡问题进行了研究。主要的创新工作和贡献包括以下几个方面:
(1)提出了新的异构扩散算法。从理论上证明了该算法的守恒性与收敛性。对不同规模的并行系统进行了试验。验证了该方法的有效性。解决了过去扩散算法只能用于同构系统的问题。
(2)在此基础上进一步提出了异构扩散的加速收敛方法。本文从理论上分析了影响异构扩散算收敛速度的因素,考察了异构系统的结构对扩散收敛速度的影响。提出了异构并行系统构造优化方法。该方法在节点连接拓扑结构不变的前提下,通过调整不同处理机的位置,提高异构扩散算法的收敛速度。初步试验表明,在一个8×8的异构系统上,收敛速度可以提高60%。
(3)提出了针对于二维格栅网格点的非规则区域划分方法-IDD方法。该方法可以在总通信量基本不增加的情况下更好地均衡计算负载。试验表明,与其它方法相比,该方法可以获得更高的并行加速比。
(4)提出在处理机计算速度测量存在误差的情况下,实现负载平衡的方法。本文提出了利用循环迭代的负反馈机制实现负载平衡。解决了节点处理速度的测量误差影响负载均衡分配的问题。试验表明,在处理机计算速度测量相对误差为30%的情况下,只需经过少量几次迭代,即可实现负载的均衡划分。
(5)在综合运用上述主要研究成果的基础上,设计建立了一个针对有限差分大规模数据并行课题的并行计算支持系统-BLPS。使用它进行并行应用程序的开发,只要遵守相应的编程规则,不必顾及区域划分、数据分配与交换,输入输出、负载平衡等并行处理过程,较大地方便了并行应用开发人员高效地使用异构分布式并行系统。它具有动态负载和多分区数据重分布功能。实验表明,它具有良好的平衡负载能力。