华为USG6330运维记录-端口回流、策略路由

1、起初虚拟化平台中使用USG6330上联ISP线路,只接入了一根线路;下联S5700三层交换机(三台做的堆叠)。在三层交换机上启了几个VLAN作为业务网端,并配置vlan地址,放置业务服务器(并未放置在DMZ);USG6330和S5700这间通过互通地址通讯,USG端10.10.12.253,S5700端10.10.12.254,所有vlan下跳地址指向10.10.12.254。所有VLAN划为trust区域,ISP为untrust区域(为后面区分,这里定义为untrustA),通过trust到untrustA的源nat区域转换,所有VLAN就可以访问外网。这种情况下所有VLAN间可以正常通信;服务器通过映射也能正常对外提供服务;非同一VLAN内的机器,从内网通过公网地址去访问内网服务器可以正常访问,但同一VLAN内的机器从内网通过公网地址互访不成功,业务初期,没有同一VLAN机器通过公网地址访问的需求,所以并未关注同一vlan、不同vlan之间通过公网IP访问的问题,事实上这是不行的。

2、随着平台扩容,在USG6330上联接口增加了一条ISP线路,划分了一个单独的untrust区域(这里定义为untrustB),下联再增加了S5700三层交换机(三台堆叠),并针对业务划分了相应的VLAN,同样划分一个互通网段作为USG6330和S5700通讯,USG端10.100.2.253,S5700端10.100.2.254。此时扩容后的VLAN间通信、到外网的访问和扩容前的配置、状况一样。扩容前和扩容后的两个环境是独立的,只是共用了防火墙,但是在防火墙下联口以下是独自运行的,使用的是策略路由进行流量控制。

3、在扩容前的平台内有一台邮件服务器(MAILA),后来在扩容后的平台内创建了一台邮件服务器(MAILB),测试发现两个服务器之间不能进行邮件通信。内网不能访问这是正常的,原因在于在逻辑上他们本来就处于独立平台中,但在MAILA上通过公网IP不能访问MAILB,MAILB也不能通过公网IP访问MAILA,同时在MAILA所在的VLAN内访问MAILA不成功,MAILB存在同样的状况。

以上问题可以归结为:

1、同一vlan内的机器不能通过公网IP互访;

2、USG6330以下不同VLAN之间通过公网IP不能互访。

同一vlan内的机器互访可以通过源NAT的方式来解决,也就是关于端口回流的问题,导致发送的请求在二次握手时出现错误,访问就会失败。被根据华为的配置事例配置即可,但配置事例中需要ISP端配置一条路由来配合,这就比较麻烦,可以用USG6330上用策略路由来做转发限制,同时配置源NAT,解决的是两个问题:源NAT解决把请求引至防火墙上;把同一个vlan内的请求用策略路由做限制是使流量不用出防火墙,解决回环路由问题。

扩容后的平台内有两条ISP线路,根据策略路由优先原则,当通过公网IP发起请求时,默认会发把求发往公网,下一跳即为USG6330上公网IP段的网关,因为回环路由原因,ISP端路由器会把这个请求直接丢弃,导致请求失败。不同vlan间的机器互相访问可直接通过策略路由限制转发来解决,使请求从源内网发起,在防火墙上查找对应NAT,在策略路由限制转发条件下使用静态路由,到达目的内网,完成请求。

解决以上问题耗时较长,解决的方式不是从最简单原理进行分析然后处理,而是一步一步试出来的,颇费周折。所以对于网络原理的学习非常重要,这样可以录活运用;对于所有的策略和配置应该做好规划便于维护。

时间: 2024-08-29 12:41:30

华为USG6330运维记录-端口回流、策略路由的相关文章

Hadoop运维记录系列(二十四)

从这篇开始记录一下集群迁移的事情 早先因为机房没地方,就已经开始规划集群搬机房的事情,最近终于开始动手了,我会把这次不停机迁移的过程遇到的主要问题和矛盾以及各种解决方法记录下来. 集群规模说大不大,几百台,总容量30PB左右.Hadoop使用CDH 5.5.1加一些自定义patch的rpm打包编译版本. 总的方案是集群不停机,在两个机房之间架设专线,旧机房decommission,拉到新机房recommission.每天不能下线太多机器,要保证计算. 新机房提前架设90台机器,测试带宽.带宽的测

Hadoop运维记录系列(十六)

应了一个国内某电信运营商集群恢复的事,集群故障很严重,做了HA的集群Namenode挂掉了.具体过程不详,但是从受害者的只言片语中大概回顾一下历史的片段. Active的namenode元数据硬盘满了,满了,满了...上来第一句话就如雷贯耳. 运维人员发现硬盘满了以后执行了对active namenode的元数据日志执行了 echo "" > edit_xxxx-xxxx...第二句话如五雷轰顶. 然后发现standby没法切换,切换也没用,因为standby的元数据和日志是5月

Hadoop运维记录系列(十四)

周末去了趟外地,受托给某省移动公司做了一下Hadoop集群故障分析和性能调优,把一些问题点记录下来. 该系统用于运营商的信令数据,大约每天1T多数据量,20台Hadoop服务器,赞叹一下运营商乃真土豪,256G内存,32核CPU,却挂了6块2T硬盘.还有10台左右的服务器是64G内存,32核CPU,4~6块硬盘,据用户反馈,跑数据很慢,而且会有失败,重跑一下就好了. 软件环境是RedHat 6.2,CDH Hadoop 4.2.1. 总容量260多TB,已使用200多T. 首先,这硬件配置属于倒

Hadoop运维记录系列(二十三)

最近做集群机房迁移,在旧机房和新机房之间接了根专线,做集群不停机搬迁,也就是跨机房,同时要新加百多台服务器,遇到几个问题,记录一下. 旧集群的机器是centos 6, 新机房加的机器是centos 7. 一.丢包问题 在跨机房的时候,datanode显示很多Slow BlockReceiver的日志 WARN  org.apache.hadoop.hdfs.server.datanode.DataNode: Slow BlockReceiver write packet to mirror to

Hadoop运维记录系列(十五)

早期搭建Hadoop集群的时候,在做主机和IP解析的时候,通常的做法是写hosts文件,但是Hadoop集群大了以后做hosts文件很麻烦,每次加新的服务器都需要整个集群重新同步一次hosts文件,另外,如果在同一个域下面做两个集群,做distcp,也需要把两个集群的hosts文件全写完整并完全同步,很麻烦.那么,一劳永逸的办法就是做DNS.DNS我这边已经用了很长时间了,几年前为了学这个还专门买了一本巨厚的BIND手册. 做DNS服务器最常用的就是BIND,ISC开发并维护的开源系统. 以ce

Hadoop运维记录系列(二十一)

Zeppelin启用https过程和Hack内核以满足客户需求的记录. 原因是这客户很有意思,该客户中国分公司的人为了验证内网安全性,从国外找了一个渗透测试小组对Zeppelin和其他产品进行黑客测试,结果发现Zeppelin主要俩问题,一个是在内网没用https,一个是zeppelin里面可以执行shell命令和python语句.其实这不算大问题,zeppelin本来就是干这个用的.但是渗透小组不了解zeppelin是做什么的,认为即使在内网里,执行shell命令能查看操作系统的一些文件是大问

网站运维记录

1.nfs客户端:安装:yum install nfs-utils -y挂载mount -t nfs 10.10.21.103:/home/elasticsearch_data/ /home/esuser/data //es数据mount -t nfs 10.10.21.103:/home/wwwroot/newsshop/public/files_pro/ /home/wwwroot/newsshop/public/files //图片数据服务端:安装 :rpc nfs配置:vi /etc/e

ZooKeeper: 简介, 配置及运维指南

1. 概览 ZooKeeper是一个供其它分布式应用程序使用的软件, 它为其它分布式应用程序提供所谓的协调服务. 所谓的协调服务, 是指ZooKeeper的如下能力 naming 命名 configuration management 配置管理 synchronization 同步 group service 分组服务 上面四个功能可能现在不太好说清, 但大致上目前你需要明白ZooKeeper就是为其它分布式应用程序提供一些基础功能的程序就好了. 我们以其中的配置管理为例. 假设你在写一个可横向

运维工程师网址导航

Linux/Unix系统教程 鸟哥私房菜 Linux系统教程,从入门到高级,全面覆盖,学习Linux必备 howtoforge 一个内核级的教程,这个教程相当不错 lartc 一个关于Linux网络路由,过滤和传输的教程 Learn Unix Soft Lookup 的一个全面的 UNIX 教程,完全可以让你从一个新手变成一个高手 Unix教程 主要用于Unix计算的基础,其中有一些很不错的示例和练习 Unix教程 来自The University of Surrey的新手指南,告诉你Unix系