公司突然断网故障排查

记一次公司断网故障排查

本来大周一挺好的,刚坐在工位上不到半个小时,公司突然断网,此时,我是有点凌乱的! 下边是排查故障的过程

1,首先我看下本机电脑的IP地址,禁用启动,发现仍旧可以获取到IP地址,这代表DHCP分发是没问题的,因为是突然断网,代表着交换机路由器配置不可能出问题

2,接着我带着笔记本进入机房,看了下光猫,光猫状态正常,然后看了下路由器,路由器是H3C的,有web管理界面,进入web管理界面,发现IP地址状态也是正常的。

4,接着给公司网络运营商打电话,他说是他们那边的问题,有个IP地址搞重复了,导致出现上不了网的原因,然后运营商调整他们的东西

5,运营商调整完之后,给我打电话,我这边将路由器配置保存,然后重启路由器,将笔记本直接接在路由器上边,可以正常上网

6,然后我将笔记本插在从路由器向下分出了的交换机上边,从路由器分出来两个交换机,插在A1交换机上边可以上网,插在A2交换机上边上不了网

7,我把A2交换机重启了下,稍等下还是不行,接着我准备把交换机换掉了(因为不是个别的,从A1  A2交换机接下去的,还是有很多交换机的,此时要做的,不是排错,而是尽快恢复网络正常)

8,我将自己的笔记本接在新的A2交换机上边,我笔记本操作系统是windows的,然后我给自己配上静态IP,在命令终端使用ping www.baidu.com -t ,接着将新的A2交换机跟路由器接好,然后看终端返回状态,发现可以正常上网,然后接着将网线一根根的插上去,在有跟网线插上去之后,发现ping www.baidu.com突然不通了,然后我将那根网线拔掉,可以正常通信,接着我将别的挨个插上去,发现没有问题,但是这个线一插上去,就不行,怀疑出现了交换机环路问题

9,然后我用寻线器,在这根网线插上去,在公司问了下,看哪个地方上不了网,然后我到哪个交换机,将网线全部拔掉,只将与机房连接的插上去,然后去机房,将网线插上去,发现可以正常通信,然后我到有故障的交换机旁边,将笔记本插上去,ping百度依旧可以正常,然后我就将网线一根根的插上去,在查到有几根根的时候,出现上不去网状况,沿着那几根网线排查,发现两端都在一个交换机上边,然后将那个几根没用的网线拔掉,恢复正常!

10,接着问了一下,是他们那边自己看到交换机那边有网线头,然后碰巧断网,他们以为是网线掉了,就给插上去了。。。。。。到此,断网问题解决,历时: 34分钟。。。。。。

问题总结:

1,出现交换机死机现象,环路现象,运营商的问题

2,环路避免方法,尽量将交换机放到柜子里,然后将没必要的网线拔掉,不要留在上边

时间: 2024-10-12 13:38:52

公司突然断网故障排查的相关文章

S7700交换机组网部分终端上不了网故障排查

本案例是多年之前遇到的一个真实故障处理过程,之后回想整个过程觉得比较有意思,因此将故障排查记录下来,现在将其分享出来,在其中隐藏了部分敏感信息.由于当时主要是做华为的服务,客户报的故障为S7700交换机的问题,因此本故障排查之初即在于S7700交换机.往往客户报的故障只是一个现象,而该现象又往往具有不确定性,因此我们需要认真的去分析网络环境,以及数据流走向,抓往一个故障点,突破一个故障面的问题.一.问题描述 两台S7700交换机配置VRRP,所有的流量主要走S3700.主S7700交换机.主H3

公司突然断网解决方案

我所处的环境就是总部,有两条线路可以上网而且互为备份.我的微信突然提示我不能联网了,当时吓的我一激灵,难不成断网了.然后我打开电脑,已经打不开网页了,PING一个公网的域名,我去,也访问不了了.然后就是一堆人过来问为是不是断网了,这些信息的反馈是整个公司挂掉了. 当时,我的脑海中想想到了很多种可能,我连的无线WLC死掉了,与WLC连接的交换机死掉了,DNS服务器死掉了,路由器死掉了,火墙死掉了,线路坏了.在这N多种可能的条件下,如果你要排错,都会让你忙死. 幸亏我有SolarWinds监控系统,

无线网络间歇断网该怎么办?

无论是网络技术的使用还是网咯故障的排查,作为网络管理员我们都应该有一定的了解,那么这里就详细的为我们说明一下.对于无线网络技术,我们有多少人很了解呢?对于无线网络出现的故障,我们这里为大家汇总了一些常见的排除技巧.排查连接方式,解决间歇断网的无线网络故障 在本地局域网通过无线路由器接入到Internet网络中的情形下,要是局域网中的工作站经常出现一会儿能正常上网.一会儿又不能正常上网的故障现象时,我们首先需要确保工作站与无线路由器之间的上网参数一定要正确,在该基础下就应该重点检查无线路由器的连接

golang 服务诡异499、504网络故障排查

事故经过 排查 总结 事故经过 11-01 12:00 中午午饭期间,手机突然收到业务网关非200异常报警,平时也会有一些少量499或者网络抖动问题触发报警,但是很快就会恢复(目前配置的报警阈值是5%,阈值跟当时的采样窗口qps有直接关系). 报警当时非200占比已经过10%并且在持续升高,根据历史规律应该很快就会恢复,我们稍微观察了几分钟(一边吃着很香的饺子一边看着手机),但是过了几分钟故障没有恢复而且占比升高了突破50%,故障逐渐升级(故障如果不在固定时间内解决会逐渐升级,故障群每次升级都会

服务器断网内外不通只能重启解决,搞了半天原来是route在搞鬼

关于我入坑 公司新项目上线前肯定要做测试,我们测试的平台搭建在一台R720服务器上,因为这台服务器在本地搭建的时候我用的是第二块网卡,所以本地给了网卡配置了网关(也就是公司的外网路由地址)用来连接我的电脑,我把服务器放在机房的时候第二块网卡的网关一直在生效,我又只配置了第一块网卡,没有配置默认路由,导致我的服务器经常断网,一断网就内外都不通,只能打电话给机房的工作人员重启来解决,最开始的时候以为是服务器故障,但是查看日志毫无报错信息,也怀疑过防火墙,已经把防火墙的开机自启都关了,甚至写了周期计划

一次无线网络故障排查

用户发来邮件说XX楼4楼无线断网,用户能连上无线,可是不能上网,部分用户能上网不过也不太稳定.由于休假,不能出现场,只能远程连上去看看到底发生了什么.以下是故障排除过程,仅供参考:1.telnet到AP连接的交换机上,通过show logg查看系统日志,发现有5个连接AP的接口出现up.down的现象,并且现象反复.使用show mac address命令查看通过上图可以看到五个接口对应的AP的MAC地址难道是接口或是线缆有问题?不过5个同时出现问题的可能性不太大,如果真是,那么只能说有中大奖的

dubbo连接zookeeper注册中心因为断网导致线程无限等待问题

最近维护的系统切换了网络环境,由联通换成了电信网络,因为某些过滤规则导致系统连不上zookeeper服务器(应用系统机器在深圳,网络为电信线路,zookeeper服务器在北京,网络为联通线路),因为我不是运维人员也不懂运维相关的技术,所以排查了很久也不知道原因,最后无奈之下把深圳这边的网络切回了联通,系统恢复正常. 但是因为本次事故体现了一个很严重的问题,即当zookeeper注册中心连不上时dubbo的线程会无限等待,因为系统有一些定时任务会比较频繁地开启新线程连接dubbo,所以导致的结果是

Rsync 12种故障排查及思路

Rsync 故障排查整理 Rsync服务常见问题汇总讲解: ============================================================================================== 1 客户端的错误现象:No route to host rsync服务端开启的iptables防火墙 [[email protected] tmp]# rsync -avz /etc/hosts [email protected]::backup r

虚拟机性能监控与故障排查工具介绍

本文来读书籍<深入理解java虚拟机-JVM高级特性与最佳实践>的阅读笔记,并且对虚拟机性能监控与故障排查一节做了内容整理. 关于导图中的两部分内容还是希望大家能够亲自测试体验下,在网上也有不少的文章介绍,这里摘录几篇个人认为不错的文章,供参考: jstat/jinfo/jstack/jmap命令行工具使用详细介绍 VisualVM 官网介绍及使用说明 使用 VisualVM 进行性能分析及调优 使用VisualVm监控远程Linux服务器java进程 由于在 linux 服务器上面,使用远程