WAF防火墙接口问题导致业务中断

一、现象描述

1、网络拓扑

2、服务器虚拟化平台的业务全部中断且无法访问,包含WAF防火墙、数据中心交换机的远程管理。

二、故障解决思路

按照OSI七层参考模型,从应用层到物理层逐层排查的思路进行。

三、故障解决方式

1、首先查看核心交换机各个接口的流量状态,查看是否存在攻击流量。查看的结果是正常的。

2、其次查看设备之间的物理链路状态,查看是否存在链路不通的情况。查看的结果是WAF防火墙连接数据中心交换机的接口和数据中心交换机的接口都不亮,从而可确认是物理链路故障导致业务中断。

3、在更换WAF防火墙与数据中心交换机之间的网络跳线确认网线没有问题的条件下,陷入的僵局。

4、单独测试数据中心交换机的接口和WAF防火墙的接口,结果发现数据中心交换机的接口正常,然而WAF防火墙的接口始终启动不了,从而可判定WAF防火墙接口的问题。

5、因为是远程排查无法登录WAF防火墙,因此,拨打WAF防火墙400电话进行询问,厂商给予的临时解决办法是重启WAF防火墙。

6、根据厂商的建议,重启WAF防火墙之后,WAF防火墙的接口正常启动,业务恢复正常。

四、打破沙锅问到底

1、WAF防火墙上联核心交换机的光口与下联数据中心交换机的点口不属于一组Bypass接口组

备注:Bypass功能:bypass,就是可以通过特定的触发状态(断电或死机)让两个网络不通过网络安全设备的系统,而直接物理上导通,所以有了Bypass后,当网络安全设备故障以后,还可以让连接在这台设备上的网络相互导通,当然这个时候这台网络设备也就不会再对网络中的封包做处理了。

时间: 2024-10-24 23:25:03

WAF防火墙接口问题导致业务中断的相关文章

橙色预警:索引空间泄露导致业务中断

写在案例分享前 承蒙大家的喜爱,我们会一直做下去! 也希望喜欢技术人生系列的朋友们,顺手帮转发一下,您的转发是我们持续分享的动力. 记得端午节和兄弟们喝酒时,有朋友说,"要不,你们成立一个用户组吧,这样更多的朋友可以以一个公益的形式加入到分享的队伍中,也可以从线上分享发展到线下分享,并且可以到各个城市中去做实战分享,让大家可以面对面的交流"; 说的有道理,于是乎,有了CESOUG,即China Experience Sharing Oracle User Group,中文名为中国经验分

STP导致链路中断问题

使用STP协议,为的是解决环路问题,然而在特殊情况下,反而会导致链路被阻断,业务中断. 某日,一用户反应,两台核心之间出现异常现象,直连时不通,但是通过一台交换机中转就通了. 上图中,二层交换机本来是作为核心A的下级交换机,接了大量服务器,网关都在核心A上,核心A与核心B之间为三层连接,互指路由通讯.改造前的结构明显不合理,客户决定将核心直接互联,但是互联后,直连接口无法PING通.线缆,接口配置都已检查过均没有问题. 到达现场,首先依旧从线缆及接口配置检查开始,将笔记本配置为核心A地址与核心B

【故障处理141119】一次数据库不繁忙时一条sql语句2个运行计划导致业务超时的故障处理

1,故障描写叙述: 一条select有两个运行计划.在sqlplus中运行选择好的运行计划.仅仅要40毫秒.而在程序中运行选择了差的运行计划,要1分23秒左右,导致前台业务超时报错. 2.故障解决: 使用outline固定好的运行计划后攻克了该故障. 3,故障发展顺序: (1),早上一上班,说CRM的一个业务报错,crm应用开发者.接口的.tuxdo.dba集中到一起開始诊断错误. (2),业务返回超时错误 (3),数据库这边抓取AWR报告发现例如以下信息: (4),此时应用开发者也发过来了该条

数据中心业务中断原因分析及业务连续性解决方案

云计算.虚拟化技术广泛运用的今天,为业务进行和维护带来方便的同时,数据中心也面临各种风险.云祺根据全球业务中断事件,以及真实案例总结出,常见的导致数据中心业务中断的三大原因. 一 硬件故障 包括服务器/存储宕机.Raid系统停止工作.内存虚拟驱动器受损等原因. 某云服务商因硬件故障导致服务器不可用数据丢失,联系服务器提供商和多家专业数据恢复公司紧急恢复后,仍多次恢复失败,最后确认数据无法恢复. 随着硬件系统发展的成熟度,针对硬件冗余方案较完善,比如双机热备.存储双活.虚拟化方式等,因硬件故障发生

防火墙接口类型介绍

防火墙接口类型 ? 物理接口1) 防火墙支持的接口可以是二层接口或者三层接口2) 二层接口:portswitch3) 三层接口:undo portswitch? 逻辑接口1) VT(virtual template)接口.dialer接口2) tunnel接口.null接口3) vlanif接口4) 三层以太网子接口5) Eth-Trunk接口.loobacp接口 防火墙的Eth-trunk ? 优点:1) 本质是要提高链路的带宽 2) 可靠性(LACP协议) 3) 负载分担 ? Eth-tru

关于线程池运行过程中,业务逻辑出现未知异常导致线程中断问题反思

最近在项目研发中的关于线程池应用过程中由于业务逻辑异常导致的线程中断,但程序未中断导致的脏数据问题  话不多说,在最近最新的一个版本发布过程中,业务需要,我们要定期去给客户预留出可用的资源数据,提供客户使用,在版本即将上线前一周测试过程中,遇到的预留资源数据跟实际数据不匹配,刚开始反复检查代码,通过日志调试一直无果,经过不懈努力,最终终于发现是由于线程在跑业务时,抛出未知异常,当前线程中断,然而主程序并未异常,导致最终响应的数据与实际不符.下面我就简答举例说明下这个问题 1.获取资源数据demo

一次客户防火墙配置导致业务故障分析

相关敏感信息去除 1.故障情况在2019年7月11日接收到值班人员反馈,在23:45开始,三套网管终端显示XXXXX.XXXXX.XXXXX所有网元脱管,在00:00恢复,持续15分钟.同时相关技术人员也反馈在此时间段,三套网管的服务器也与各自网元中断联系,也是持续15分钟.本次故障从7月11日发现,到7月14日解决,一共持续了4天.2.拓扑说明防火墙采用采用透明模式部署在服务器与网管网络之间,配置相应的安全策略.整个网络使用二层数据交换,不涉及路由转发3.采取措施经过线路检测,设备检测,数据包

juniper防火墙配置失误导致断网

我所在的公司用的是juniper srx 550防火墙.个人感觉juniper的设备还是很人性化的.一些常用配置都比较容易理解,比如说NAT ,ACL等. 因为业务需要,我要在防火墙上启懂dy-vpn ,就是动态VPN.在网上找了很久,就只能扎到SRX240的一个案例.只能先对照着试一下.结果发现确实有配置不一致的地方.只能摸索着调试.不凑巧的是我调试的设备是生产环境,更不凑巧的是我调试出了问题,导致部分网络中断,之后又莫名其妙的无法管理设备,在之后的一个下午设备各种网络不稳定,在之后的晚上设备

ufs文件系统下inode耗尽导致业务进程重启失败

一次业务升级后,发现生产系统上的业务进程UPRG无法启动,日志里面报错:can not create UPRG.log,但是观察/logs目录剩余空间还有很多.尝试直接在/logs下touch文件也失败,也是报can not create file. 第一反应是/logs目录的权限是否被人误改了?但很快便发现目录权限正常. 第二反应是磁盘坏了,但想想磁盘是RAID1,不可能两个盘都坏了,而且系统日志里面没有任何磁盘报错. 第三反应是分区表坏了,但如果分区表坏了,应该cd都不能进去. ... 最后