当前l7xgw的健康检查机制主要是基于nginx_upstream_check_module来完成的
1.实现机制
1.1 HTTP/HTTPS监听健康检查机制
针对七层(HTTP或HTTPS协议)监听,健康检查通过HTTP HEAD/GET探测来获取状态信息,如下图所示。
七层监听的检查机制如下:
L7XGW根据监听的健康检查配置,向后端ECS的内网IP+【健康检查端口】+【检查路径】发送HTTP HEAD/GET请求。
后端ECS收到请求后,根据相应服务的运行情况,返回HTTP状态码。
如果在【响应超时时间】之内,L7XGW没有收到后端ECS返回的信息,则认为服务无响应,判定健康检查失败。
如果在【响应超时时间】之内,L7XGW成功接收到后端ECS返回的信息,则将该返回信息与配置的状态码(一般默认是2xx, 3xx)进行比对。如果匹配则判定健康检查成功,反之则判定健康检查失败。
1.2 TCP监听健康检查机制
针对四层TCP监听,为了提高健康检查效率,健康检查通过定制的TCP探测来获取状态信息,如下图所示。
TCP监听的检查机制如下:
L4XGW根据监听的健康检查配置,向后端ECS的内网IP+【健康检查端口】发送TCP SYN数据包。
后端ECS收到请求后,如果相应端口正在正常监听,则会返回SYN+ACK数据包。
如果在【响应超时时间】之内,L4XGW没有收到后端ECS返回的数据包,则认为服务无响应,判定健康检查失败;并向后端ECS发送RST数据包中断TCP连接。
如果在【响应超时时间】之内,L4XGW成功收到后端ECS返回的数据包,则认为服务正常运行,判定健康检查成功,而后向后端ECS发送RST数据包中断TCP连接。
1.3 UDP监听健康检查
针对四层UDP监听,健康检查通过UDP报文探测来获取状态信息,如下图所示。
UDP监听的检查机制如下:
L4XGW根据监听的健康检查配置,向后端ECS的内网IP+【健康检查端口】发送UDP报文。
如果后端ECS相应端口未正常监听,则系统会返回类似port XX unreachable的ICMP报错信息,反之不做任何处理。
如果在【响应超时时间】之内,L4XGW收到了后端ECS返回的上述错误信息,则认为服务异常,判定健康检查失败。
如果在【响应超时时间】之内,L4XGW没有收到后端ECS返回的任何信息,则认为服务正常,判定健康检查成功。
2.配置详解
nginx_upstream_check_module该模块对应的配置示例如下:
check interval=5000 rise=2 fall=2 timeout=2000 type=http;
check_http_send "HEAD / HTTP/1.0\r\n\r\n";
check_http_expect_alive http_2xx http_3xx;
2.1 check指令
check interval=5000 rise=2 fall=2 timeout=2000 type=http;
该指令可以打开后端服务器的健康检查功能。指令后面的参数意义是:
interval:向后端发送的健康检查包的间隔,单位为毫秒。
fall(fall_count): 如果连续失败次数达到fall_count,服务器就被认为是down。
rise(rise_count): 如果连续成功次数达到rise_count,服务器就被认为是up。
timeout: 后端健康请求的超时时间,单位毫秒。
default_down: 设定初始时服务器的状态,如果是true,就说明默认是down的,如果是false,就是up的。默认值是true,也就是一开始服务器认为是不可用,要等健康检查包达到一定成功次数以后才会被认为是健康的。
type:健康检查包的类型,现在支持以下多种类型:
tcp:简单的tcp连接,如果连接成功,就说明后端正常。
ssl_hello:发送一个初始的SSL hello包并接受服务器的SSL hello包。
http:发送HTTP请求,通过后端的回复包的状态来判断后端是否存活。
mysql: 向mysql服务器连接,通过接收服务器的greeting包来判断后端是否存活。
ajp:向后端发送AJP协议的Cping包,通过接收Cpong包来判断后端是否存活。
port: 指定后端服务器的检查端口。你可以指定不同于真实服务的后端服务器的端口,比如后端提供的是443端口的应用,你可以去检查80端口的状态来判断后端健康状况。默认是0,表示跟后端server提供真实服务的端口一样。该选项出现于Tengine-1.4.0。
2.2 check_http_send指令
check_http_send "HEAD / HTTP/1.0\r\n\r\n";
该指令可以配置http健康检查包发送的请求内容。为了减少传输数据量,推荐采用"HEAD"方法。
2.3 check_http_expect_alive指令
check_http_expect_alive http_2xx http_3xx;
该指令指定HTTP回复的成功状态,默认认为2XX和3XX的状态是健康的。
以上就是当前XGW网元所使用的健康检查的原理以及对应的指令配置方式。