论文部分内容阅读
随着人类对科学文明探究的深入,现有的计算机硬件、软件和网络发展水平远赶不上人们对计算机的需求。因此,网格计算的概念便由此诞生。网格通过联合位于不同地域的资源为完成共同的一个项目提供服务。由于网格资源分布在不同的物理位置,并具有很强的自主性,因此任务在网格系统中执行具有一定的失败风险。为了保证提交到网格系统中执行的任务能够顺利地完成,必须对任务的执行采取一定的容错性保障措施。
论文首先介绍了网格的相关理论及其关键技术,随后引入了中间件的概念,并对网格中间件的相关项目进行了详细的探讨。接着,对网格容错技术中冗余调度技术进行深入的分析,已有的基于稳定性概率的冗余调度方案能够保证任务成功的概率,但是容易出现任务调度到性能比较低资源节点执行,任务执行时间长。因此提出了可靠性概率的概念。资源节点可靠性概率综合考虑了资源节点的稳定性、负载以及性能。结合任务在资源节点执行的期间CPU空闲率、内存空闲率等因素给出一种资源节点可靠性概率的预测方案。该方案根据资源节点的历史数据对资源节点未来可能表现出来的可靠性概率进行预测。基于该可靠性概率预测方案,针对现有基于稳定性概率的冗余调度算法不足,提出一种基于可靠性概率冗余调度的改进算法。实验数据表明,在保证一定的可靠性概率的前提下,新提出的冗余调度算法在执行总时间上优于原有的冗余调度算法。
结合提出的可靠性概率预测方案和改进的冗余调度算法,论文给出了基于冗余调度的可靠网格计算中间件设计开发方案,对开发完成网格中间件在局域网内进行了实例测试,测试结果表明该中间件提高了任务执行的成功率,缩短了任务执行的总时间,有效地执行上传的任务,运行稳定。最后,对基于改进冗余调度的可靠网格计算中间件进行评价和总结,并提出了进一步工作的建议。