现象描述:
公司有几十台电脑,之前一直工作稳定正常,但最近一个星期,却总是有员工抱怨说邮件收发不了。
ping mail.XXXX.com 时而能ping通,时而不通。
间断时间不连续。发作频率不固定。甚至连用网高峰低谷都没有关系。让我好生郁闷。
首先问了一下当时配置的整个系统的网络工程师,把情况描述完了之后,他没有好的解决方向和办法。
这种情况,明显是dns解析不顺,所以我第一时间怀疑可能是联通的dns问题。
咨询了一下联通的网络工程师,他给我的意见可能是带宽不够,我说,可能的确是这原因,但也有不对的地方。
因为如果真的是带宽不够,应该是每个人会出现上网卡顿,或者持续性频繁断线。
我开始怀疑是不是人为因素。
抓了一下包,发现没有异常的包,而且在网络规划阶段,就把冲突域划分的比较好,中arp病毒的可能性不大。
而且早些年,分析病毒时,接触过arp病毒事件,在大庆处理过。不是这种现象。
还是查一下吧。
这个地址的确是有些异常的,但经查,每台机器都有这种情况,且地址能Ping通,并且此地址不是我分配的,也没有正常的网络通讯。
虽然不懂为什么,但是基本判断此地址是个正常的广播地址。
因为我通过其它人,在公司外访问公司的域名,均没有任何问题,所以问题原因集中如下:
1、问题很可能出在公司内部。
2、dns域名解析出错。
3、很有可能是带宽拥挤造成。
4、基本处在可设置路由的设备上。
5、这样,我需要排查的设备包括三层交换机、上网行为、防火墙,飞鱼星设备。
综合判断了一下,基本出在飞鱼星设备上。
打电话给飞鱼星工程师。没有好意见。我说有一个“启用DNS缓存转发”功能是不是有可能。
他说,也有可能这块出问题。我把此功关掉,心想,有可能是这块造成的dns转发错误。结果发现没有什么改观。
结果,不久,全公司掉网。中午饭也没有心思吃,吃了一半回来找原因。
我去,ping不通飞鱼星设备了,找笔记本直接对接,也ping不通。不能是设备坏了吧。晕死,赶到这个时候,真是倒霉。
强制reset吧,重配了一遍,好赖能ping通了,没坏掉就好。一步步配好后,可以上网了,但是依然有之前的故障。郁闷了。
暂时这样吧。
回家的路上,把整个思路顺了一遍,发现一个现象,就是当我用飞鱼星设置好第一条宽带时,域名解析,是短暂的好用的,过了一会不好用的。
我想是不是该设备的ios智能流控技术有问题了。
所以第二天上班马上关掉其它宽带,只留一条,发现还是问题依旧,有点绝望了。
但是发现每当对此设备做改动的时候,就会引起一点变化,所以越来越肯定和此设备有关了。
然后,把此设备的设置完全详细的检查了一遍,发现了原因。
在网络安全项里,有一条最大连接数量是1000,又观察了一下当前的连接数量,发现瞬值会达到1000。豁然开郞。
问题应该彻底解决了。
总结:
随着网络应用的增加,以及业务量的提升。有必要对各类设备的设置加强了解。不然的话,很可能一个小小的设置带来的后果,就足以影响到公司的正常运转,基础要扎实啊。