11、实战场景题(50分)
问题:
1、请根据题干内容提供说明该故障排查思路、问题定位和原因,要求逻辑清晰,有论证能力。
背景:
某金融客户OSPF协议骨干网生产环境DMZ部署两台SSL VPN网关,三层旁挂核心,反向代理模式,HA部署,两台设备的接口地址分别为10.10.1.1,10.10.1.2,其中VIP地址为10.10.1.3。
故障现象:
运维处反馈故障现象为个别业务系统BS架构无任何征兆的情况下存在中高频率的业务通讯故障(业务时好时坏,断断续续),经科技处排查判断该问题与我司提供的SSL VPN设备有关,跳过vpn产品业务正常,运维的结论是SSL VPN产品没有正常往后端设备转包。
故障排查:
1、通过SSL VPN的debug trace tacp all拿到全接口流量包。
2、分析SSL VPN主机抓包内容判断业务的Virtual Service对应的地址有向后端转发大量SYN包没有回包。
3、业务正常在SSL VPN后端对应的Real Service实地址Nginx主机上tcpdump抓包有收到上游发来的SYN包并正常回SYN,ACK报完成三次握手。
4、业务异常期间抓包发现SSL VPN后端对应的Real Service实地址Nginx主机上tcpdump抓包没有收到上游回的最后一次ACK报。
5、经排查HA主机Active、备机Standby状态正常,浮动VIP正常切换。
6、SSL VPN与Nginx中间没有任何审计拦截设备。