通过对相关数据包的深入分析,我们发现,出现故障的时候,网关222.111.66.1 ARP表中没有了222.111.66.180的条目,或者有但不正确。
这说明网关找不到服务器222.111.66.180,进而造成丢包。
如下图,故障期间,从采集点2看到,网关222.111.66.1上的ARP表信息发生变化,网关无法获取到服务器222.111.66.180的MAC地址。
网关多次广播查询服务器MAC地址,均无结果。
接着,我们从采集点1看,即在服务器上看。
如下图框选内容,服务器看到了寻找它的ARP请求,但没有响应。这里的ARP信息和采集点2看到的一模一样。
这里,由于服务器本身原因,造成故障。
那么,故障又是如何恢复的呢?
在服务器经历一段时间的数据包重传后,服务器180主动更新一次ARP信息。下图Frame 274表示服务器询问网关的MAC地址,Frame 275是网关立即响应,告诉了自身物理地址。
故障立即消失。
这里,也是由于服务器本身的动作,应用恢复正常。
分析结论