博文目录
一、IRF概述
二、IRF具有哪些优点
三、IRF的基本概念
1、角色
2、IRF端口
3、IRF物理端口
4、IRF合并
5、IRF分裂
6、成员优先级
四、IRF的运行模式与配置方式
五、IRF的工作原理
1、物理连接
2、拓扑收集
3、角色选举
4、IRF的管理与维护
六、多IRF冲突检测(MAD功能)
1、多IRF冲突检测的定义和功能
2、多IRF冲突检测的方式和原理
七、配置IRF
八、IRF和MAD涉及的查询类命令如下
一、IRF概述
IRF(Intelligesilient Framework,智能弹性架构)是H3C自主研发的硬件虚拟化技术。它的核心思想是将多台设备通过IRF物理端口连接在一起,进行必要的配置后,虚拟化成一台“分布式设备”。使用这种虚拟化技术可以集合多台设备的硬件资源和软件处理能力,实现多台设备的协同工作、统一管理和不间断维护。
目前的IRF是一种将多个设备虚拟为单一设备使用的通用虚拟化技术,此技术已经应用于高、中、低端多个系列的交换机设备,通过IRF技术形成的虚拟设备具有更高的扩展性、可靠性及性能。
二、IRF具有哪些优点?
- 简化管理:IRF形成之后,用户通过任意成员设备的任意端口都可以登录IRF系统,对IRF内所有成员设备进行统一管理。
- 高可靠性:IRF的高可靠性体现在多个方面。例如,IRF由多台成员设备组成,master设备负责IRF的运行、管理和维护,slave设备在作为备份的同时也可以处理业务。一旦master设备故障,系统会迅速自动选举新的master,以保证业务不中断,从而实现了设备的1:N备份。此外,成员设备之间的IRF链路支持聚合功能,IRF和上、下层设备之间的物理链路也支持聚合功能,多条链路之间可以互为备份也可以进行负载分担,从而进一步提高了IRF的可靠性。
- 扩展力:通过增加成员设备,可以轻松自如地扩展IRF的端口数,带宽。因为各成员设备都有CPU,能够独立处理协议报文及进行报文转发,所以IRF还能够轻松自如地扩展处理能力。
三、IRF的基本概念
1、角色
IRF中每台设备都称为成员设备,成员设备按照功能不同,分为两种角色:
- Master:负责管理整个IRF。
- Slave:作为master的备份设备运行。当master故障时,系统会自动从slave中选举一个新的master接替原master工作。
master和slave均由成员设备选举产生。一个IRF中同时只能存在一台master,其他成员设备都是slave。
2、IRF端口
一种专用于IRF的逻辑端口,分为IRF-Port2,需要和IRF物理端口绑定之后才能生效。
3、IRF物理端口
设备上可以用于IRF连接的物理端口。IRF物理端口可能是IRF专用接口,以太网接口或者光口(设备上哪些端口可用作IRF物理端口与设备型号有关,要以实际情况为准)。通常情况下,以太网接口和光口负责向网络中转发业务报文,当它们与IRF端口绑定后就成为了IRF物理端口,用于成员设备之间转发报文。可转发的报文包括IRF相关协商报文及需要跨成员设备转发的业务报文。
4、IRF合并
两个IRF各自已经稳定运行,通过物理连接和必要的配置,形成一个IRF,这个过程就是IRF合并。
5、IRF分裂
一个IRF形成后,由于IRF链路故障,IRF中两相邻成员设备物理上不连通,一个IRF变成两个IRF,这个过程就是IRF分裂。
6、成员优先级
成员优先级是成员设备的一个属性,主要用于角色选举过程中确定成员设备的角色。优先级越高当选master的可能性越大,设备的默认优先级为1,如果想让某台设备当选master,则在组建IRF前,可以通过命令行手动提高该设备的成员优先级。
四、IRF的运行模式与配置方式
IRF的运行模式分为IRF模式和独立运行模式,设备出厂时默认处于独立运行模式。若在本次运行过程中,没有修改设备的运行模式,则下次启动会继续使用本次启动的运行模式;若在本次运行过程中,修改了设备的运行模式,则设备会自动重启,切换到新的模式。
chassis convert mode irf命令用来将设备的运行模式切换到IRF模式。
配置方式分为预配置方式和非预配置方式。预配置方式是在独立运行模式的设备上进行IRF相关配置,最终组成IRF只需要重启一次。非预配置方式是先在独立运行模式的设备上配置成员编号,然后切换到IRF模式,再配置IRF端口、成员优先级等相关参数。slave设备需要重启两次才能组成IRF。
五、IRF的工作原理
1、物理连接
要形成一个IRF,需要先连接成员设备的IRF物理端口。
2、拓扑收集
每个成员设备和邻居成员设备通过交互IRF Hello报文来收集整个IRF的拓扑。IRF Hello报文会携带拓扑信息,具体包括IRF端口连接关系、成员设备编号、成员设备优先级、成员设备的桥MAC等内容。
3、角色选举
确定成员设备角色为master或slave的过程称为角色选举,角色选举会在拓扑变更的情况下产生,如IRF建立、新设备加入、master设备离开或故障、两个IRF合并等。
角色选举规则如下:
- 当master优先(IRF系统形成时,没有master设备,所有加入的设备都认为自己是master,会跳转到第二条规则继续比较)。
- 成员优先级大的优先。
- 系统运行时间长的优先。
- 桥MAC地址小的优先。
从第一条开始判断,若判断的结果是多个最优,则继续判断下一条,直到找到唯一最优的成员设备才停止比较。此最优成员设备就是master,其他成员设备就都是slave。
4、IRF的管理与维护
角色选举完成之后,IRF形成,所有的成员设备组成一台虚拟设备存在于网络中,所有成员设备上的资源归该虚拟设备拥有并由master统一管理。
1)成员编号
在运行过程中,IRF系统使用成员编号(Master ID)来标志和管理成员设备,并在端口编号和文件系统中引入成员编号的标识信息。该编号关系到整个IRF的管理和运行,因此,需要用户在设备加入IRF前统一规划、配置设备的成员编号,以保证IRF中成员编号的唯一性。
2)接口命名规则
对于单独运行的设备(即没有加入任何IRF),接口编号采用设备编号/子槽位编号/接口序号的格式,其中,默认情况下,设备编号为1。若设备曾经加入过IRF,则在退出IRF后,仍然会使用在IRF中时的成员编号作为自身的设备编号。子槽位编号即接口所在子槽位的编号。成员设备编号用来标识不同成员设备上的接口。子槽位编号和接口序号的含义及取值与单独运行时一样。
3)文件系统命名规则
对于IRF中的成员设备,直接使用存储介质的名称可以访问master设备的文件系统,使用“slotmember-ID#存储介质的名字”才可以访问slave设备的文件系统。
4)配置文件的同步
IRF技术使用了严格的配置文件同步机制,来保证IRF中的多台设备能够像一台设备一样在网络中工作,并且在master设备出现故障之后,其余设备仍能够正常执行各项功能。
IRF中的slave设备在启动时,会自动寻找master设备,并将master设备的当前配置文件同步到本地并执行;若IRF中的所有设备同时启动,则slave设备会将master设备的起始配置文件同步至本地并执行。
在IRF正常工作后,用户所进行的任何配置,都会记录到master设备的当前配置文件中,并同步到IRF中的各个设备执行;用户在执行save命令时,如果开启了配置文件同步保存功能(默认为开启),master设备的当前配置文件将被同步保存到IRF的所有成员设备上,作为起始配置文件,以便使IRF中所有设备的起始配置文件保持统一;如果未开启配置文件同步保存功能,当前配置文件将仅在master设备上进行保存。通过即时的同步,IRF中所有设备均保存有相同的配置文件,即使master设备出现故障,其他设备仍然能够按照相同的配置文件执行各项功能。
5)IRF拓扑维护
如果某成员设备A down或者IRF链路down,其邻居设备会立即将“成员设备A离开”的信息广播通知给IRF中的其他设备。获取到离开消息的成员设备会根据本地维护的IRF拓扑信息表来判断离开的是master还是slave,如果离开的是master,则触发新的角色选举,再更新本地的IRF拓扑;如果离开的是slave,则直接更新本地的IRF拓扑,以保证IRF拓扑能迅速收敛。
六、多IRF冲突检测(MAD功能)
当存在多个IRF时会涉及一下问题。
1、多IRF冲突检测的定义和功能
IRF链路故障会导致一个IRF变成两个新的IRF。这两个IRF拥有相同的IP地址等三层配置,会引起地址冲突,导致故障在网络中扩大。为了提高系统的可用性,当IRF分裂时需要一种机制能够检测出网络中同时存在多个IRF,并进行相应的处理,以尽量降低IRF分裂对业务的影响。MAD(Multi-Active Detection,多Active检测)就是这样一种检测和处理机制。它主要提供以下功能。
1)分裂检测:通过LACP(Link Aggregation Control Protocol,链路聚合控制协议)或者免费ARP(Gratuitous Address Resolution Protocol)来检测网络中是否存在多个IRF。
2)冲突处理:IRF分裂后,通过分裂检测机制IRF会检测到网络中存在其他处于active状态(标识IRF处于正常工作状态)的IRF。冲突处理会让master成员编号最小的IRF继续正常工作(维持active状态),其他IRF会迁移到recovery状态(表示IRF处于禁用状态),并关闭recovery状态IRF中所有成员设备上除保留端口以外的其他所有物理端口(通常为业务接口),以保证该IRF不能再转发业务报文。
3)MAD故障恢复:IRF链路故障导致IRF分裂,从而引起多active冲突。因此修复故障的IRF链路,使冲突的IRF重新合并为一个IRF,就能恢复MAD故障。若在MAD故障恢复前,处于recovery状态的IRF也出现了故障,则需要将故障IRF和故障链路都修复后,才能让冲突的IRF重新合并为一个IRF,恢复MAD故障;若再MAD故障恢复前,故障的是active状态的IRF,则可以通过命令行先启用recovery状态的IRF,让它接替原IRF工作,以便保证业务尽量少受影响,再恢复MAD故障。
IRF分裂后,竞选失败的IRF会自动关闭所有成员设备上的部分端口(等效于在接口下执行shutdown命令),但有些端口不会被自动关闭,这些端口称为保留端口。默认情况下,只有IRF物理端口是保留端口,如果要将其他端口(如用于远程登录的端口)也作为保留端口,需要使用命令行进行手工配置。
2、多IRF冲突检测的方式和原理
IRF支持的MAD检测方式有LACP MAD检测、BFD MAD检测和ARP MAD检测。三种检测方式虽然原理不同但是功能效果相同,能够满足不同组网的需求。LACP MAD检测用于基于LACP的组网检测需求;BFD MAD检测用于基于BFD的组网检测需求;ARP MAD检测用于基于非聚合场合的Resilient ARP的组网检测需求。这三种方式独立工作,彼此之间互不干扰。因此,同一IRF内可以配置多种MAD检测方式。
1)LACP MAD检测的原理:LACP MAD检测时通过扩展LACP协议报文内容实现的,即在LACP协议报文的扩展字段内定义一个新的TLV(Type/Length/Value,类型/长度/值)数据域,用于交互IRF的Domain ID(域编号)和Active ID。当网络中同时存在多个IRF时(如IRF级联的组网情况),Domain ID用于区别不同的IRF。当某个IRF分裂时,Active ID用于MAD检测,用IRF中master设备的成员编号来表示。使能LACP MAD检测后,成员设备通过LACP协议报文和其他成员设备交互Domain ID和Active ID信息。
如上图所示,当成员设备收到LACP协议报文后,先比较Domain ID;如果Domain ID相同,再比较Active ID;如果Domain ID不同,则认为报文来自不同IRF,不再进行MAD处理。如果Active ID相同,则表示IRF正常运行,没有发生多Active冲突,如果Active ID不同,则表示IRF分裂,检测到多Active冲突。
2)BFD MAD检测的原理:BFD MAD检测是通过BFD协议实现的。要使BFD MAD检测功能正常运行,除在三层接口下使能BFD MAD检测功能外,还需要在该接口上配置MAD ID地址。MAD IP地址与普通IP地址不同的地方在于MAD IP地址与成员设备是绑定的,IRF中每个成员设备上都需要配置,且必须属于同一网段。
当IRF正常运行时,只有master上配置的MAD IP地址生效,slave设备上配置的MAD IP地址不生效,BFD会话处于down状态。可以通过display bfd session命令查看BFD会话的状态,若session state显示为up,则表示处于激活状态;若显示为down,则表示处于关闭状态。IRF分裂后会形成多个IRF,不同IRF中master上配置的MAD IP地址均会生效,BFD会话被激活,此时会检测到多Active冲突。
3)ARP MAD检测的原理:ARP MAD检测是通过扩展免费ARP协议报文内容实现的,即使用免费ARP协议报文中未使用的字段来交互IRF的Domain ID和active ID。domain ID和active ID的定义及比较方法同LACP MAD检测相同。使能ARP MAD检测后,成员设备可以通过免费ARP协议报文和其他成员设备交互domain IP和active ID信息。ARP MAD适用于使用MSTP双上行的组网。当IRF正常运行时,MSTP功能会阻塞某条链路,使免费ARP报文无法到达另一台成员设备,不会发生多active冲突。IRF分裂后会形成两个或多个IRF,MSTP将重新计算拓扑,原先阻塞的链路被打开,不同IRF中的成员设备便可以接收到另一个IRF发送的免费ARP协议报文,从而检测到多active冲突。
4)三种MAD检测的适用性分析如下表所示,一般来说,高可靠性要求下可以使用BFD MAD检测。
啰嗦了一大堆,原理性的东西也就说完了,下面简单配置一个IRF技术的案例。
原文地址:https://blog.51cto.com/14156658/2436020