图3-2-1-3
如图3-2-1-3所示,监控服务器从servers上搜集系统信息,如果发觉系统的某项状态指数超出预设的信噪比,则发送电邮至维保人员。同时,把相应的报案信息发送至邮件运营商的邮件网段服务器,然后邮件网段服务器发送邮件至维保人员相机中,完成邮件报案。上述报案过程,传送电邮报案信息,是基于TCP/IP协议,而传送邮件报案信息,是基于gprs网路。
1.2.1.4 故障转移
故障转移是指,当对用户提供服务的服务器或则相应的应用进程发生故障后,比如服务器宕机、进程僵死以后,备用服务器才能在尽量短的时间内启用,提供服务。这样就能最大限度降低损失,保证用户的正常服务。所以,做好故障转移,要解决以下两个问题:
(1)实时检测故障问题。
(2)准确迅速切换服务器问题。
针对不同层次的服务,监测体系也不同,详细状况,在3.2.1.3早已解读。下面主要阐述一下故障切换问题。
故障切换包括负载均衡器的故障切换、主机os的故障切换、web server的故障切换、应用进程的故障切换、数据库的故障切换、存储系统的故障切换、DNS的故障切换、交换设备的故障切换等。下面主要剖析进程僵死的故障转移跟服务器宕机的故障转移。
进程僵死故障转移案例,常见的web server僵死故障转移如图3-2-1-4所示。
图3-2-1-4-2
如图3-2-1-4-2所示大带宽服务器,服务器A跟服务器B同时布署,但服务器A提供服务,而服务器B作为热备机。监控系统单独布署。当服务器A宕机以后,监控系统会检查至这一信息,然后通过浮动修改服务器B的ip地址,完成故障切换。