一起奇怪的网络问题解决过程

现象描述:

公司有几十台电脑,之前一直工作稳定正常,但最近一个星期,却总是有员工抱怨说邮件收发不了。

ping mail.XXXX.com 时而能ping通,时而不通。

间断时间不连续。发作频率不固定。甚至连用网高峰低谷都没有关系。让我好生郁闷。

首先问了一下当时配置的整个系统的网络工程师,把情况描述完了之后,他没有好的解决方向和办法。

这种情况,明显是dns解析不顺,所以我第一时间怀疑可能是联通的dns问题。

咨询了一下联通的网络工程师,他给我的意见可能是带宽不够,我说,可能的确是这原因,但也有不对的地方。

因为如果真的是带宽不够,应该是每个人会出现上网卡顿,或者持续性频繁断线。

我开始怀疑是不是人为因素。

抓了一下包,发现没有异常的包,而且在网络规划阶段,就把冲突域划分的比较好,中arp病毒的可能性不大。

而且早些年,分析病毒时,接触过arp病毒事件,在大庆处理过。不是这种现象。

还是查一下吧。

这个地址的确是有些异常的,但经查,每台机器都有这种情况,且地址能Ping通,并且此地址不是我分配的,也没有正常的网络通讯。

虽然不懂为什么,但是基本判断此地址是个正常的广播地址。

因为我通过其它人,在公司外访问公司的域名,均没有任何问题,所以问题原因集中如下:

1、问题很可能出在公司内部。

2、dns域名解析出错。

3、很有可能是带宽拥挤造成。

4、基本处在可设置路由的设备上。

5、这样,我需要排查的设备包括三层交换机、上网行为、防火墙,飞鱼星设备。

综合判断了一下,基本出在飞鱼星设备上。

打电话给飞鱼星工程师。没有好意见。我说有一个“启用DNS缓存转发”功能是不是有可能。

他说,也有可能这块出问题。我把此功关掉,心想,有可能是这块造成的dns转发错误。结果发现没有什么改观。

结果,不久,全公司掉网。中午饭也没有心思吃,吃了一半回来找原因。

我去,ping不通飞鱼星设备了,找笔记本直接对接,也ping不通。不能是设备坏了吧。晕死,赶到这个时候,真是倒霉。

强制reset吧,重配了一遍,好赖能ping通了,没坏掉就好。一步步配好后,可以上网了,但是依然有之前的故障。郁闷了。

暂时这样吧。

回家的路上,把整个思路顺了一遍,发现一个现象,就是当我用飞鱼星设置好第一条宽带时,域名解析,是短暂的好用的,过了一会不好用的。

我想是不是该设备的ios智能流控技术有问题了。

所以第二天上班马上关掉其它宽带,只留一条,发现还是问题依旧,有点绝望了。

但是发现每当对此设备做改动的时候,就会引起一点变化,所以越来越肯定和此设备有关了。

然后,把此设备的设置完全详细的检查了一遍,发现了原因。

在网络安全项里,有一条最大连接数量是1000,又观察了一下当前的连接数量,发现瞬值会达到1000。豁然开郞。

问题应该彻底解决了。

总结:

随着网络应用的增加,以及业务量的提升。有必要对各类设备的设置加强了解。不然的话,很可能一个小小的设置带来的后果,就足以影响到公司的正常运转,基础要扎实啊。

时间: 2024-10-13 19:31:50

一起奇怪的网络问题解决过程的相关文章

记录sqoop同步失败问题解决过程,过程真的是很崎岖。(1月6日解决)

记录sqoop同步失败问题解决过程,过程真的是很崎岖.事发原因:最近突然出现sqoop export to mysql时频繁出错.看了下日志是卡在某条数据过不去了,看异常.看sqoop生成的mr并未发现问题.最后把要export的原始数据拿notepad++打开发现中断的数据是奇怪的乱码,查了一下是二进制的数据. 乱码数据生成原因:我理解,api接口时接收流数据时长度和实际长度不符. 解决办法:两块要解决,一是接口时做好容错,二是同步时还是要对这种二进制做兼容,因为谁也无法保证二进制数据不会再出

局域网上网问题解决过程

前几天局域网改了ip之后就突然不能上网,以为是ip冲突,于是又换一个,这样换了n个,依然上不了,每次都是改了以后显示已连接,数秒之后显示受限,以为是网卡驱动的原因,卸了装卸了又装,重复n遍之后木有任何效果.后来又以为是硬件原因,ping了局域网中其它机器的ip,能ping通,这说明网卡应该还是可以收发数据应该没坏的,但为什么就是不能上网呢?启动windows自带的问题诊断,显示dns未响应,(后来发现,这尼玛坑啊太多原因能导致这个结果了),于是乎又开始查看dns服务有没有启动,又换了几个常用dn

vmware虚拟机克隆CentOS7 出现的网络问题解决办法

http://www.bubuko.com/infodetail-1483490.html(转) vmware虚拟机克隆CentOS7 出现的网络问题解决办法 时间:2016-04-02 07:17:00                         阅读:578                         评论:0                         收藏:0                         [点我收藏+] 1.删除/etc/sysconfig/network

CrossApp 0.3.1示例编译问题解决过程

1 AlertTest.h找不到 问题成因:HelloCpp工程中头文件搜索路径没有增加Classes目录,需要自己加进去.(另外由于这些文件都是在子目录中,用递归模式也行,逐个子目录添加也行) 2 CrossApp lib编译错误. (1) Unknown register name 'q0' in asm 按照网上说法,把对应的#if defined(__ARM_NEON__)替换成 #if defined(_ARM_ARCH_7)即可. (2) "Cast from pointer to

一个测试问题解决过程

邮件提醒来了一个测试问题需要我分派,文本框输入a:b:c(业务需要,内容以英文冒号分隔),"系统提示xxx格式不规范,系统未将全角:转换为半角.",我看完未过多细想,flex前端没做过,易用性问题,直接分派给功能开发人员小王同学,接下来发生了一些事情. 小王开始抱怨,有病啊,没事开什么全角输入,怎么测试呢-: 小王找我这问题不改了,让把问题打回,有一个理由控制BUG数量: 咋一看,小王说的有道理啊,琢磨了一下,不对啊,(情绪上不能对立,测试也是为了产品质量)测试不至于这么测吧,问题里说

VMware克隆Linux系统后,网络问题解决

VMware克隆Linux系统后,新系统网络问题Device eth0 dose not seem to be present的解决方法. 今天学习Linux到一定阶段了,需要用到二台机器同时开启,于是用VMware克隆了开始正常使用的第一台Linux系统.克隆操作还是很简单的,一会好了,重新启动后,想使用xshell连接,先看了克隆出来的新机器,就叫cloner吧,ifconfig只有loop口是正常工作,于是使用service network restart重启网络服务看看好没好,结果出现下

VCenter中嵌套openstack VM不能ping通外部网络问题解决的方法

问题描写叙述: 近期搭建了vCenter环境,并使用vCenter创建的VM搭建了一套openstack环境.在验证openstack的外网功能时.发现报文死活ping不通外网,抓包发现报文在vcenter的dvs处给丢掉了,这是很奇怪的事情.细致排查后.现vCenter居然感知报文的mac对于不受vCenter管理的VM发出的报文直接忽视. 先上图: watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400

VCenter中嵌套openstack VM不能ping通外部网络问题解决办法

问题描述: 最近搭建了vCenter环境,并使用vCenter创建的VM搭建了一套openstack环境,在验证openstack的外网功能时,发现报文死活ping不通外网,抓包发现报文在vcenter的dvs处给丢掉了,这是非常奇怪的事情,仔细排查后,现vCenter竟然感知报文的mac对于不受vCenter管理的VM发出的报文直接忽视. 先上图: 解释如下: 1)ESX-B016是安装了VMWare ESX的主机,受vCenter管理和控制,我使用vCenter创建一个虚拟分布式交换机(dv

OSPF路由网络建立过程

发现邻居--选举DR/BDR--形成链路状态数据库--SPF算法--形成路由网络 在 发现邻居--选举DR/BDR 阶段路由器之间互相发送Hello报文,根据Hello包,每台路由器生成了基本的Datebase:然后根据优先级和RID在每一个网段选出一个DR/BDR:这个时候路由器处在two-way状态. 在 形成链路状态数据库--SPF算法--形成路由网络 过程中,首先互相发送DBD报文,互相交换Datebase,这个时候路由器处于Exstate状态:如果发现收到的Datebase和自己的有出