MPLS及LDP协议基础
文\贾欣武
1 MPLS基础
1.1 MPLS的产生及现状
MPLS概念的最初提出是为了提高转发效率。因为当时IP转发大多靠软件进行,在转发的每一跳都要进行至少一次最长匹配查找,操作复杂导致转发速度比较慢。有些厂商借鉴ATM的转发方式来简化IP转发过程,由此产生了一种结合IP和ATM的优势于一身的新技术——MPLS。在当时的条件下这可以说是一个很大的创举,其优势也是显而易见的,但后来IP转发领域有很多新技术产生,如硬件转发与网络处理器的出现,导致MPLS的速度优势体现不出来,纯MPLS转发在实际应用中几乎没有用武之地。
但MPLS是一个很有“潜力”的技术,可灵活扩展。很多新的应用依靠纯IP转发实现起来有很大的难度,但用MPLS再结合其它技术就可以实现,如:BGP/MPLS VPN、流量工程等技术的产生就是对MPLS灵活扩展的结果。当前,MPLS越来越受重视,成为当今网络技术的热点,还有一些新的应用需求也正在利用MPLS来实现。
1.2 MPLS相关概念
1.2.1 Label
即标签,在帧模式链路上,Label位于二层头与IP报文之间,一个Label头的结构如下:
图 1 标签格式
Label:标签值,长度为20bit,标签值是标签转发表的关键索引
Exp:: 用于QoS,长度为3bit,作用与Ethernet802.1p值相似
S: 栈底标识,长度为1bit,如果有多个Label时,在栈底的Label的S位置“1”,其它为“0”。只有一个Label时S位置“1”
TTL: 存活时间,8bit,与IP报文中的TTL值相似,这个值从IP报文头的TTL域拷贝过来,每进行一次Label交换时,外层Label的TTL值就减“1”
需要注意的是一个MPLS报文可以有多个Label,靠近二层头的Label为栈顶Label,靠近IP报文的Label为栈底Label,LSR执行Label交换时总是基于栈顶Label。有多个Label时,每个Label都包括以上完整的32bit,并不是其它的Label只包括20bit的Label值,如下图所示:
图 2 多层标签
1.2.2 LSR(Label Switching Router)
采用标签交换转发报文的路由器。
1.2.3 LER(Label Edge Router)
标记边缘路由器,处在MPLS网络的边缘,负责将进入MPLS网络的报文或帧对应到具体的FEC并打上Label,变成MPLS帧转发;将离开MPLS网络的帧去掉Label还原成原来的报文或帧再查找相应的转发表转发。
1.2.4 FEC(Forwarding Equivalence Class)
LSR认为具有相同转发处理方式的报文,使用同一个标签来标记这些报文。如:匹配相同目的IP前缀的多个IP报文可属于一个FEC,由于这些报文在做IP转发时是相同的转发处理方式及路径,所以标记这些报文的时候用同一个标签。
1.2.5 PUSH(加标签)
在第一跳Ingress LER上在报文的二层头和三层头之间插入Label,或者中间LSR在MPLS报文的标签栈顶增加新的Label。
1.2.6 POP(弹出标签)
在最后一跳Egress LER上将报文中的Label全部去掉,还原成IP报文,或者中间LSR去掉栈顶标签减少标签栈层次。
1.2.7 SWAP(交换标签)
在转发的过程中根据标签转发表中的LSP替换报文中栈顶Label的过程。
1.2.8 LSP(Label Switched Path)
标记转发路径,也就是转发MPLS报文的路径。
1.3 MPLS转发方式
MPLS技术综合了第二层交换和第三层路由的功能,将第二层的快速交换和第三层的路由有机地结合起来。MPLS网络边缘的LER主要完成以下工作:三层路由、分析IP包头用于决定对应的FEC和标签交换路径(LSP),进而标记报文。而在MPLS网络核心的LSR采用基于标签的第二层交换,工作相对较简单。从这里就可以看出MPLS的好处,虽然处在MPLS网络边缘的LER工作较复杂,但处在核心的LSR只需要像FR或ATM交换机那样执行二层交换就可以了,根本不需要最长匹配和多次查找。
典型的MPLS转发过程如下:
Step 1: 所有LSR启用传统路由协议(OSPF、IS-IS等),在LSR中建立IP路由表
Step 2: 由LDP结合IP路由表来建立LSP
Step 3: Ingress LER接收IP包,分析IP包头并对应到FEC,然后给IP包加上标记,根据标签转发表中的LSP将已标记的报文送到相应的出接口。
Step 4:LSR收到带有标记的报文,将只分析标记头,不关注标记头之上的部分,根据Label头查找LSP,替换Label,送到相应的出接口
……………..(中途转发过程与Step 4类似)
Step n-1:倒数第二跳LSR收到带有标记的报文,查找标记转发表,发现对应的出口标签为隐式空标签或显式空标签,弹出标签,发送IP报文到最后一跳LSR
Step n:在最后一跳Egress LER上执行三层路由功能,根据报文的目的IP地址转发
2 LDP协议初步
LDP协议在[RFC 3036]中详细定义,LDP的协议报文除Hello报文基于UDP外,其它报文都是在TCP之上,端口号为646。当发生传输丢包时,能够利用TCP协议提供错误指示,实现快速响应和恢复。与BGP相似,这种基于TCP的可靠连接使得协议状态机较为简单。
2.1 报文格式
2.1.1 LDP PDU 头部
图 3 LDP PDU 头部
版本号:16bit,目前LDP只有一个版本,版本号始终为1;
PDU长度:为16bit,值为LDP PDU头部以后的数据部分的长度,不包括LDP PDU头部;
LDP Id:长度为48bit,前32bit为LSR-ID,后16bit为标记空间标志,全局空间为“0”,局部接口空间为“1”。如:收到的LDP PDU中的LDP-ID为192.168.1.2:0,表示对方的LSR-ID为192.168.1.2,标签空间为全局空间。
2.1.2 LDP 消息格式
图 4 LDP消息格式
U:这一位总是为“0”,代表可识别的消息,为“1”代表不可识别的消息;
类型域:协议根据这个域识别不同的消息;
长度域:指示出长度域之后的数据部分的长度;
消息ID:用来唯一地标识这个消息,如果消息为Notification,则ID与导致产生Notification的消息ID相关联。
2.2 消息种类
按照功能分类,LDP协议中总共有四类消息
邻居发现消息:在启用LDP协议的接口上周期性发送该消息
Ø Hello消息
会话建立和维护消息:用来建立和维护LDP会话
Ø Initialization消息
Ø KeepAlive消息
标签分发消息:用来请求、通告及撤销标签绑定
Ø Address message
Ø Address Withdraw message
Ø Label request message
Ø Label mapping message
Ø Label withdraw message
Ø Label release message
Ø Label abort request message
错误通知消息:用来提示LDP对等体在会话过程中的重要事件
Ø Notification消息
2.3 LDP相关概念
2.3.1 标签空间
可分为全局标签空间和接口标签空间,全局标签空间表示LSR为特定目的地的FEC产生唯一的Label,接口标签空间表示LSR在每个接口上为特定目的地的FEC产生唯一的Label。在帧模式的链路上为全局标签空间,在信元模式的链路上为接口标签空间。LDP报文中的LDP-ID域中指示出标签空间值。
2.3.2 上游和下游LSR
图 5 上/下游定义
如图所示,对于某FEC(图示中的IPv4前缀)来说,C是B的下游路由器,A是B的上游路由器
2.3.3 倒数第二跳弹出(Penultimate Hop Popping)
在实际应用当中(如MPLS VPN),对于Egress LSR在弹出最外层Label后还需要进行其它较复杂的三层工作。而事实上最外层标签的作用在MPLS VPN的应用中只是为了将报文送到Egress LSR。因此,在倒数第二跳LSR已知报文下一跳的情况下,可以将最外层的标签弹出后转发到最后一跳LER,而不必进行标签替换。这样使得最后一跳LSR的工作相对简单了一些。因此在 [RFC 3032] 中规定,最后一跳LSR发给倒数第二跳LSR的标签为隐式空标签“3”。据此,收到标签“3”的上游LSR就知道自己是该FEC的倒数第二跳,就知道自己在用该LSP转发Label报文时,应执行倒数第二跳弹出。
图 6 倒数第二跳弹出
2.4 标签分发方式
2.4.1 DU(Downstream Unsolicited)
下游LSR如果工作在DU方式(下游主动分发)下将根据某一触发策略向上游LDP邻居主动分发标签。下图中LSR-C标签分发触发策略是为直连32位掩码的路由分配标签,因此LSR-C通过Label mapping message向上游LDP邻居主动通告自己的直连路由172.16.1.1/32的标签,Comware系统缺省工作在DU方式。
图 7 下游主动分发
2.4.2 DOD(Downstream On Demand)
下游LSR如果工作在DOD方式(下游按需分发)下,只有在接收到上游LDP邻居的Label request message后才回应Label mapping message分发标签(针对标记请求消息所指定的FEC)。下图中LSR-C工作在DOD模式下,LSR-A的触发策略生效(LSR-A转发到172.16.1.0/24的报文流量达到设定阀值)后将向172.16.1.0/24的下游发送标记请求消息Label request message(请求172.16.1.0/24的标签)。最终LSR-C收到请求,发送Label mapping message响应。
图 8 下游按需分发
2.5 标签控制方式
2.5.1 独立控制方式(Independent)
LSR如果工作在独立控制方式下,如果标签分发方式是DU,即使在没有获得下游标签的情况下也会直接向上游分发标签。在标签控制的方式上显得很“独立”,不依赖下游LSR;如果标签分发方式是DOD,发送标签请求的LSR的直连上游LSR会直接回应标签,而不必等待来自最终下游的标签。
图 9 独立控制方式
在上图中,在LSR-B上采用独立控制方式。LSR-B路由表中有172.16.1.0/24的路由,但没有收到下游来的标签绑定。由于LSR-B工作于独立控制方式,所以对路由表中的所有路由都向上游发送标签。继而,无论LSR-A工作在独立模式还是有序模式,将向上游继续发送标签。这时,如果有目的IP为172.16.1.0/24的报文进入LSR-A,它将采用MPLS转发。但数据到LSR-B后,由于没有关联172.16.1.0/24的LSP,所以采用传统IP转发。
2.5.2 有序控制方式(Odered)
LSR如果工作在有序控制方式下,如果标签分发模式为DU,则只有收到下游LSR分发的标签时才会向自己的上游LSR通告标签,如果没有收到下游的标签映射则不向上游LSR通告。Comware系统缺省工作在有序方式。
图 10 有序控制方式
在上图中,LSR-B路由表中有172.16.1.0/24的路由,但由于LSR-B没有收到下游的标签且工作在有序模式,因而不向上游通告关于172.16.1.0/24的Label。如果LSR-A收到目的IP为172.16.1.0/24的报文将采用传统IP转发。可以看出,在有序控制方式下,是否向上游LSR分发标签取决于自己是否收到下游LSR的标签。
2.6 标签保留方式
2.6.1 自由保留模式(Liberal retention mode)
收到无效的Label通告后(没有对应的IP路由或路由通告与Label通告的下一跳不一致),虽然不生成LSP,但在标签绑定表里存储,并且LSR向上游通告其它FEC的Label绑定时也不占用这些标签,这种方式的优点是LSR应对网络拓扑变化的响应较快,缺点是浪费标签,所有不能生成LSP的Label通告都需要保留。
图 11 自由保留模式
在上图中LSR-A工作于自由保留方式,对于FEC为172.16.1.0/24将生成下一跳为LSR-B的LSP,LSR-C发来的Label通告将保留。如LSR-A和LSR-B之间的直连链路down掉,对于FEC:172.16.1.0/24的将很快生成下一跳为LSR-C的LSP。
2.6.2 保守保留模式(Conservative retention mode)
工作于保守保留模式的LSR收到无效的Label通告后将不存放到标签绑定表里,在向上游通告Label时可以自由使用这些标签。保守保留模式的缺点是对拓扑变化的响应较慢,优点是节省标签。
图 12 保守保留模式
在上图中,LSR-A工作于保守保留模式,对于FEC为172.16.1.0/24将生成下一跳为LSR-B的LSP,LSR-C发来的Label通告将不保留。如LSR-A和LSR-B之间的直连链路down掉,对于FEC:172.16.1.0/24将不能很快生成下一跳为LSR-C的LSP。
2.7 LDP会话建立过程
下图中用一个示例来演示LDP会话建立过程:
Step 1 :互发Hello消息,Hello消息中包括LDP-ID和Transport Address。双方将用Transport Address建立LDP会话,收到Hello消息后再进一步比较Transport Address确定由谁作为主动方发起TCP连接。Transport Address大的一方将作为主动方发起TCP连接。被动方等待对方发起连接。在下图中将由LSR-B作为主动方发起TCP连接。
Step 2 :TCP连接完成后由LSR-B发送Initialization消息来协商参数,包括:LDP协议版本、Label分发方式、HoldTime、接收者的LSR-ID等。
Step 3:如果接收Initialization的LSR-A发觉对方的参数自己不能接受,则发送Notification消息结束会话:否则的话由LSR-A回应Initialization消息同时也发KeepAlive消息,两个消息可以在一个报文中同时携带。
Step 4:如果LSR-B接受Initialization消息中携带的参数则发送KeepAlive,LDP会话成功建立。可以在同一个报文中携带KeepAlive消息和其它Session消息,如Address消息和Label mapping消息。
报文交互过程如下:
图 13 LDP会话建立过程
在此过程中,LSR检测到任何错误都会发Notification报文关闭连接。
2.8 状态机描述
1、NON EXISTENT状态:该状态类似BGP的Idle状态,为LDP会话的最初状态。在此状态双方发送Hello消息,选举主动方,在收到TCP连接建立成功事件的触发后变为INITIALIZED状态。
2、INITIALIZED状态:在该状态下分主动方与被动方两种情况,主动方将发送Initialization报文,转向OPENSENT状态,等待回应的Initialization消息;被动方在此状态等待主动方发给自己Initialization消息,如果收到的Initialization报文的参数可接收,则发送Initialization和KeepAlive转向OPENREC状态。主动方和被动方在此状态下收到任何非Initialization消息或等待超时,都会转向NON EXISTENT状态。
3、OPENSENT状态:此状态为主动方发送Initialization报文后的状态,在此状态等待被动方回答Initialization消息和KeepAlive消息,如果收到的Initialization消息中的参数可以接受则转向OPENREC状态;如果参数不能接受或Initialization消息超时则断开TCP连接转向NON EXISTENT状态。
4、OPENREC状态:在此状态不管主动方还是被动方都是发出KeepAlive后的状态,在等待对方回应KeepAlive,只要收到KeepAlive消息就转向OPERATIONAL状态;如果收到其它消息或者KeepAlive超时,则转向NON EXISTENT状态。
5、OPERATIONAL状态:它是LDP Session成功建立的标志。在此状态下可以发送和接收所有其它的LDP消息。在此状态如果KeepAlive超时或者收到致命错误的Notification消息(Shutdown消息)或者自己主动发送Shutdown消息主动结束会话,都会转向NON EXISTENT状态。
图 14 LDP协议状态机