论文部分内容阅读
在信息化建设迅猛发展的今天,机房的规模不断扩大,并且地理位置趋向分散,为了保证各种硬件设备持续稳定地运行,机房管理员的工作也越来越繁重。在对机房的监控过程中,虽然网络和服务器主机的正常运行是首要目标,但关系机房环境的动力设备的运行状况同样不可忽视。不稳定的电力或是不合适的温湿度会对硬件设备产生难以估量的破坏作用,同时由此引起的故障点难以快速定位,有可能引发较长时间的服务中断,进而影响人们的正常工作和生活。
面对大量分散的设备,管理员不得不频繁前往机房进行巡查,这样一方面无谓的浪费了大量的时间,另一方面在异常发生时仍然无法快速定位故障点。针对这个问题,本文提出了统一监控平台的概念,旨在设计一个基于网络的,架构清晰、功能明确的监控系统,将服务器主机与各种动力设备抽象统一为平等的监控对象,并能通过多种渠道及时有效的向机房管理员报告异常情况,以高效的监控手段有效的减轻机房工作人员的工作压力,加快故障发生时的反应速度,从而使得机房设备更加持续稳定地运行。
为了实现统一监控的目的,本文引入了统一数据总线的概念,并为系统的核心设计了一种高效的、可扩展的通信报文协议,保证了监控数据及指令的有效传输。在后半部分,作者用Python语言实现了一个精简的原型系统,同时利用AIR技术实现了桌面监控端,解决了其他基于浏览器的监控方案的多种弊病。最后通过在北京大学校园网进行实际应用实践,达到了预先设定的目标,证明了统一监控平台设计的有效性。