我所处的环境就是总部,有两条线路可以上网而且互为备份。我的微信突然提示我不能联网了,当时吓的我一激灵,难不成断网了。
然后我打开电脑,已经打不开网页了,PING一个公网的域名,我去,也访问不了了。然后就是一堆人过来问为是不是断网了,这些信息的反馈是整个公司挂掉了。
当时,我的脑海中想想到了很多种可能,我连的无线WLC死掉了,与WLC连接的交换机死掉了,DNS服务器死掉了,路由器死掉了,火墙死掉了,线路坏了。在这N多种可能的条件下,如果你要排错,都会让你忙死。
幸亏我有SolarWinds监控系统,第一时间登录,看到了火墙的外部接口死掉了。虽然我们设置了一条浮动路由,如果监控到火墙挂掉,会自动走另一条线路,居然没有起作用,关键时掉链子,我内心中默念了N多遍(省略吧)
立即冲进机房,把火墙重启了,问题就解决了。
经验总结:问题发生,一定要有监控工具,否则排错太痛苦。再好的设计也有不工作的时候,关键还是靠重启呀。
原文地址:https://blog.51cto.com/shadingyu/2421094
时间: 2024-12-15 00:37:00