IRF(Intelligent Resilient Framework,智能弹性架构)是H3C自主研发的软件虚拟化技术,也是H3C数据中心解决方案的核心技术,使用这种虚拟化技术可以集合多台设备的硬件资源和软件处理能力,实现多台设备的协同工作、统一管理和不间断维护,IRF+跨框聚合是对传统MSTP+VRRP组网架构的突破和优化,极大地简化了网络管理、提高了系统可靠性。但是如果IRF系统发生了分裂,是否会造成网络业务中断?下面介绍的MAD检测技术就是专门应对这种情况的。
IRF一旦分裂后,网络中就会存在两台独立的、配置信息一模一样的网络设备,就会导致网络中IP地址、Router-ID、MAC等设备基本信息冲突和路由信息紊乱,造成MAC漂移、路由震荡等网络业务异常。
MAD检测的作用就是当IRF系统分裂后,能够在毫秒级的反应时间内,将分裂后冗余配置的设备从网络中隔离出去,保持现网设备特征的唯一性。
MAD检测技术从它的报文类型区分,主要有两种:
通过LACP协议报文内容实现的LACP MAD检测;
通过BFD协议报文内容实现的BFD MAD检测;
两种MAD检测的检测效果是差不多的,都能实现毫秒级的故障切换,但是由于其本身的实现机制,对于不同的用户组网条件,需要选择合适的MAD检测方式。
LACP MAD检测是利用LACP报文扩展字段实现的,使能了MAD检测后设备会在LACP报文中携带一个新的TLV,其中定义了该设备所在IRF系统的Active-ID(即Master设备的Member-ID,系统内唯一)。其实现原理如下图所示:
当IRF系统正常运行时,系统内所有设备携带的Active-ID都是一致的,此时MAD检测不会生效;
当IRF系统分裂后,即一个系统分裂为了多个系统,分裂的系统由于设备的Member-ID不一样,所以就产生不同的Active-ID,此时通过LACP报文交互就可以感知到不同Active-ID的存在;
检测到不同Active-ID存在后,设备如果发现自己的Active-ID是最小的,保持现状;如果发现自己Active-ID不是最小的,就会Shutdown设备上所有业务端口(IRF口除外),即会将Active-ID不是最小的设备全部从网络中隔离出来;
LACP MAD协议实现原理决定了,该MAD技术适合部署于以下组网环境下:
IRF设备与下联设备间运行LACP方式的动态跨框聚合链路;
下联设备必须支持识别并转发LACP报文中携带Active-ID字段的TLV,当前只有H3C的交换机支持该LACP扩展特性;
组网中没有任何链路资源浪费,LACP MAD部署链路同时可以作为数据转发使用,且不影响用户的网络层次模型。
BFD MAD检测是利用BFD Session的建立原理实现的。部署 BFD MAD需要在在IRF系统上建立一个独立的Vlan-interface,该VLAN需要包含IRF系统内各成员设备至少一个UP状态的物理端口,并且在给每一个成员设备都配置一个MAD IP,利用设备对BFD报文的收发机制判断系统是否分裂。实现原理如下:
当IRF系统正常运行时,Slave设备的MAD IP地址不生效,所以BFD Session处于DOWN状态,此时MAD检测不生效;
当IRF系统分裂后,Slave设备变为Master设备,其MAD IP生效,BFD Session立即转为UP,设备就能立即检测到多Master冲突;
系统Member ID大的设备,检测到冲突后立就会Shutdown设备上所有业务端口(IRF口除外),即会将Member ID不是最小的设备全部从网络中隔离出来;
LACP MAD协议实现原理决定了,该MAD技术适合部署于以下组网环境下:
IRF系统设备互联的设备均不支持LACP MAD协议报文中继;
IRF系统成员设备间存在独立的链路专门用于BFD MAD检测功能;
本文介绍了两种针对IRF系统分裂的冲突检测技术,IRF技术的出现大大的简化了网络结构和运维管理复杂度,其本身的可靠性对于组网来说非常重要,MAD技术的实现就是对IRF技术的完善。对于部署了IRF系统的数据网络,建议大家根据组网特点,选择合适的IRF MAD检测技术进行部署,进一步提高网络的高可靠性。