面向机群系统问题诊断的路径分析方法与应用研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:songyonghuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
凭借良好的性价比,可扩展性和故障隔离性,机群在科学计算,事务处理和网络服务等不同领域都获得了广泛的应用。   分布式的体系结构和资源特征,决定了机群系统中的典型应用为分布式应用。当这种复杂的应用出现服务失效或性能问题时,如何快速的分析问题产生的原因并进行有效的问题诊断成为机群系统管理中的一个重要的研究问题。   路径分析技术是近年来针对分布式系统性能分析和故障诊断问题的一个研究热点。其核心思想是通过端到端(end-to-end)跟踪分布式系统对一个任务的处理过程,构造系统运行时控制流路径,从而对系统行为进行动态建模和可视化分析,帮助人们理解系统和有效地进行问题诊断。   然而,目前针对分布式系统的路径分析方法存在着不足之处。大部分方法依赖全局唯一的路径标志符实现路径关联机制,需要对应用的源代码、通信中间件或协议进行较大的修改,实施的复杂性和难度较高,通用性较差;另一些方法通过事件的时间关系推断应用的路径模式,实现简单,通用性强,但是准确性和抗干扰性较差,影响了在实际应用中的效果。   针对目前路径分析技术的不足,本文提出了基于happen-before因果顺序关系的路径关联模型和方法,在此基础上,针对典型的机群应用设计和实现了分布式系统问题诊断的方法和原型系统,并通过一系列实验验证了方法和模型的有效性。   具体而言,本文的主要研究成果和创新贡献包括:   1)提出了任务行为图(TAG)的因果路径分析模型,基于该模型提出了基于happen-before因果顺序关系的路径关联机制,并设计和实现了新的关联算法。与同类方法相比,本文实现的方法不需要对应用、中间件和网络协议的源代码进行任何修改,大大降低了方法的复杂性和部署成本;同时在没有显著增加算法复杂度的情况下,大大提高了关联路径的准确率和抗干扰性;   2)提出了基于因果路径延迟分析的性能问题诊断方法,通过对并发路径模型的规约,分类,聚合和profiling分析等操作,准确的发现和定位多层并发网络服务系统的性能问题;   3)提出了基于分布式系统交互特征的故障诊断机制和基于故障传播路径的失效分析方法,可以作为轻量级的分布式系统调试器帮助用户分析应用失效原因和定位故障根源;   4)在此基础上,设计和实现了面向机群系统问题诊断的原型系统PathAnalyzer,并通过一系列实验验证了方法和模型的有效性。
其他文献
随着高性能计算技术的迅猛发展,机群系统在航空航天、石油勘探、气象预测等领域的应用越来越广泛。在2007年11月全球高性能计算机Top500排名中,机群系统结构占总数的81.20%,并且
随着定位技术的不断提升和定位设备的大量普及,获取人与物体的位置信息变得愈加便捷。与此同时,随着物联网(Internet of things)技术的不断成熟,通过海量的传感器定时发送相关数
近年来,随着计算机网络与通信技术的快速发展,P2P网络模式以其可扩展性、高度容错性等突出优点变得越来越流行。在仅有的几年时间里,P2P应用已发展成为了占用Internet流量的
计算机的使用越来越普及,但信息安全缺陷所引发的问题却越来越显著。因此,在生产生活中对信息安全产品、科研、教育和培训的需求越来越旺盛。随着信息安全相关的产品开发、研究
无线传感器网络的应用前景十分广阔,能够广泛应用于军事、环境监测、医疗健康、交通管理以及商业应用等领域。虽然传感器节点有着各种各样不同的应用,但这些应用对传感器节点有
机群I/O设备共享是机群管理的一个重要部分。目前占市场主流的基于纯软件系统实现机群I/O设备共享的方式在系统的跨平台特性,可扩展性,对服务器资源的占用等方面存在不足。随着
在Web和企业信息化等领域,XML已经被接受为一种标准的信息交换格式。XML的自描述,与平台无关的特性使得它被用作不同系统间通信的数据格式,如用于Web Services中SOAP消息的载体
星载计算机(On-Board Computer,OBC)是卫星中完成控制和计算任务的现代数字计算机系统,它是卫星综合电子系统的控制和管理中心,在民用和军用领域都发挥着重要作用。星载计算机对
自上世纪70年代关系数据库诞生以来,数据集成就一直是数据库领域的研究热点和难点问题。传统的数据集成研究依赖于元数据级别的模式映射和模式转换技术,较好地解决了结构级别的
随着互联网的迅猛发展,流媒体应用如远程教学、视频会议、网上直播等日益流行,这些应用都体现了流媒体信息大数据量、高质量、实时流畅的主要特点。对等网络(Peer-to-Peer Ne