STP导致链路中断问题

使用STP协议,为的是解决环路问题,然而在特殊情况下,反而会导致链路被阻断,业务中断。

某日,一用户反应,两台核心之间出现异常现象,直连时不通,但是通过一台交换机中转就通了。

上图中,二层交换机本来是作为核心A的下级交换机,接了大量服务器,网关都在核心A上,核心A与核心B之间为三层连接,互指路由通讯。改造前的结构明显不合理,客户决定将核心直接互联,但是互联后,直连接口无法PING通。线缆,接口配置都已检查过均没有问题。

到达现场,首先依旧从线缆及接口配置检查开始,将笔记本配置为核心A地址与核心B互联,通;反之也通。排除线缆及接口配置问题。

第二步,在核心A上检查ARP表,空白,没有对端的ARP表项。

第三步,接口下无任何针对对端MAC的限制策略,没有IP+MAC绑定

第四步,检查STP状态,发现STP将核心A与核心B的互联口阻断。

直接原因找到,但是从眼前的拓扑结构来说,不应该阻断接口,换一种情况,如果核心A与核心B之间确实还有一条没有找到的线路,那么线路中间串一个二层交换机,为什么就不会阻断接口了,而且业务是正常的,没有出现被环路影响的情况。核心A与核心B之间是三层互联,使用路由通信,本身也就不会有二层环路。

下面再举个例子说明一下

两台交换机两个线互联,两边的G0/0/1口属于vlan10,两边的G0/0/2口属于vlan20,这种情况下是否是环路,如果开启STP会出现什么情况。

从实际效果来说,这不是环路,vlan10和vlan20内的广播报文是不会传到对方vlan内的,这也是划分vlan的主要目的之一。但是开启了STP后,是会阻断一个口的。

这里最关键的一点就是,STP报文与vlan无关,它是协议报文,不论接口下划分什么类型,放行或阻断什么vlan都不会阻碍它的传递。这也就解释了上图的现象。

那么返回最初的问题,接口被阻断的原因知道了,为什么中间串了二层交换机就正常了,其实也狠简单,那台二层交换机没有开启STP协议,收到STP报文后就直接丢弃了,所以核心A与核心B在STP这个层面里感知只有一条线路是互联的。

最后,那条不知道隐藏在哪里的线路依旧没有找到,也许那中间又串了几台交换机。这个故障其实是可以避免的,在进行网络设计及改造的时候,交换机之间在逻辑上应该要保证只有一条线路,可以多口进行捆绑。合理、规范的设计可以为后期的网络运维避免很多的疑难杂症,切记切记。

时间: 2024-08-08 13:56:31

STP导致链路中断问题的相关文章

WAF防火墙接口问题导致业务中断

一.现象描述 1.网络拓扑 2.服务器虚拟化平台的业务全部中断且无法访问,包含WAF防火墙.数据中心交换机的远程管理. 二.故障解决思路 按照OSI七层参考模型,从应用层到物理层逐层排查的思路进行. 三.故障解决方式 1.首先查看核心交换机各个接口的流量状态,查看是否存在攻击流量.查看的结果是正常的. 2.其次查看设备之间的物理链路状态,查看是否存在链路不通的情况.查看的结果是WAF防火墙连接数据中心交换机的接口和数据中心交换机的接口都不亮,从而可确认是物理链路故障导致业务中断. 3.在更换WA

橙色预警:索引空间泄露导致业务中断

写在案例分享前 承蒙大家的喜爱,我们会一直做下去! 也希望喜欢技术人生系列的朋友们,顺手帮转发一下,您的转发是我们持续分享的动力. 记得端午节和兄弟们喝酒时,有朋友说,"要不,你们成立一个用户组吧,这样更多的朋友可以以一个公益的形式加入到分享的队伍中,也可以从线上分享发展到线下分享,并且可以到各个城市中去做实战分享,让大家可以面对面的交流"; 说的有道理,于是乎,有了CESOUG,即China Experience Sharing Oracle User Group,中文名为中国经验分

关于线程池运行过程中,业务逻辑出现未知异常导致线程中断问题反思

最近在项目研发中的关于线程池应用过程中由于业务逻辑异常导致的线程中断,但程序未中断导致的脏数据问题  话不多说,在最近最新的一个版本发布过程中,业务需要,我们要定期去给客户预留出可用的资源数据,提供客户使用,在版本即将上线前一周测试过程中,遇到的预留资源数据跟实际数据不匹配,刚开始反复检查代码,通过日志调试一直无果,经过不懈努力,最终终于发现是由于线程在跑业务时,抛出未知异常,当前线程中断,然而主程序并未异常,导致最终响应的数据与实际不符.下面我就简答举例说明下这个问题 1.获取资源数据demo

python中如果在while循环中是return会导致循环中断

[[email protected] root]# cat test_while_return.py count = 0while (count < 6):   print 'The count is:', count   count = count + 1 print "Good bye!" print '-'*20 while (count >= 3):   print 'The count is:', count   count -= 1print "Goo

物理链路导致RIP路由震荡

物理链路导致RIP路由震荡 公司网络使用正常,突然出现部分网络通信不正常现象,但是一般经过1.2分钟的时间就能自己恢复.这种现象不定时的发生,有时半小时发生一次,有时3小时发生一次,经查看rip路由表发现故障时,在路由表中没有出现故障的网段. 当出现上述故障时,可以按照下列处理顺序进行处理: 1. 路由振荡原因分为两个方面. 1) 由于链路状态的改变造成的路由改变. 2) 由于网络设计不严谨造成的,出现大量的同值选路或路由状态更新振荡的情况,防止问题的主要方案是在设计网络时要求所有的流量和选路要

STP安全

STP安全简介 STP(spanning-treeprotocol)的运行并不是"无懈可击"的,STP的运行中也存在安全隐患,所以需要用到STP的安全机制来解决这些潜在的隐患.本实验就来介绍3种STP的安全机制:Bpdu Guard.RootGuard.Loop Guard. 原理:交换环境中,STP在运行过程中通过发送BPDU的方式来选举root及维护STP的运行.而STP的安全规则也是通过对BPDU的"监测"来实现的.实施STP的安全规则是对接入的交换设备进行限

16.HCNA-HNTD——STP原理与配置

STP(Spanning Tree Protocol)是生成树协议的英文缩写.该协议可应用于在网络中建立树形拓扑,消除网络中的环路,并且可以通过一定的方法实现路径冗余,但不是一定可以实现路径冗余.生成树协议适合所有厂商的网络设备,在配置上和体现功能强度上有所差别,但是在原理和应用效果是一致的. 生成树协议的主要功能有两个:一是在利用生成树算法.在以太网络中,创建一个以某台交换机的某个端口为根的生成树,避免环路.二是在以太网络拓扑发生变化时,通过生成树协议达到收敛保护的目的. 为了提高网络可靠性,

【CCNA学习笔记】STP

STP(Spanning-Tree Protocol,生成树协议),该协议可应用于在网络中建立树形拓扑,消除网络中的环路,并且可以通过一定的方法实现路径冗余. 1.1 冗余拓扑中存在的问题 图1-1 单一链路的拓扑 图1-2 有冗余链路的拓扑 图1-1中,PC1和PC2只通过单一链路传输,如果该链路出现故障,会导致通信中断. 图1-2中,加入了冗余链路,解决了SW1和SW2单链路故障引起的网络中断. 但是图1-2中,可能存在的问题: 1.广播风暴 存在广播通过f1/1口出去,然后又通过f1/2口

通讯链路的检测方法

问题背景: TCP不能及时通知连接中断,如果使用keep-live机制默认时间是2小时11分钟15秒没有通讯才会发送探测消息,如依靠TCP超时机制可能要等待9分钟才能检测出网络中断,因此必须用户自己检测连接是否正常. 连接中断可能的原因: 1)一方主机崩溃 发不出FIN,对等方依靠重发检测链路中断,如果崩溃方在对等方准备撤销连接之前又重新启动了,若此时收到了消息则会回复RST消息给对等方,这将导致对等方撤销连接,对等方会收到ECONNECREST错误,或者下一次读导致SIGPIPE信号或EPIP