论文部分内容阅读
随着移动数字化时代的发展和大数据时代的到来,计算机和网络已经成为我们日常生活中不可分割的一部分。多机协同的高性能服务器现在已经被广泛的应用到各个领域中,与此同时这类服务器一旦出现故障所带来的影响也日益严重。因此对服务器的高可用技术的研究,确保服务器为用户提供稳定持续的服务就变得愈发重要。高可用性的实现可以从硬件和软件的角度实现。高可靠的硬件采用新的设计技术使得硬件本身具有更低的故障率,但追求硬件性能提高本身就会带来更高的故障率,这给硬件的设计带来很大的困难,同时也提高了高可用硬件设计的成本,所以在多服务器平台下更多的是应用管理软件实现高可用性。本文对现有的高可用技术进行研究,从容错和负载均衡两方面展开,包括心跳检测、数据同步、故障切换、双机热备、负载均衡模式和调度算法等技术。选择合适的技术,针对实际的服务器架构特点,设计了与结构相匹配的高可用服务器管理软件并在麒麟系统上实现了该软件。在容错性上,针对负载均衡层和真实节点层不同的容错需求设计了两种不同的心跳诊断和故障处理机制。在负载均衡层应用了VRRP网络冗余协议的思想,既保证了失效节点的快速诊断和切换也维护了单一的对外IP资源,屏蔽了系统的内部结构;在真实工作节点层,采用加速心跳机制一定程度的规避了故障的误检率,同时实现对真实节点失效的故障隔离。在负载均衡研究中针对现有的负载均衡方案的不足,引入虚拟转换端口实现新的跨局域网NAT模式,可以更好的应对后端真实工作服务器处于不同局域网的情况,保证了系统的可扩展性。在设计中采用了模块化的设计思想,将系统的功能分配给各个功能模块完成,并提供一个远程Web和命令行结合的管理员接口来监控系统的运行状态。