一、高速路由器體系結構的演變
路由器本質上是一種特殊的計算機,無論是高速核心路由器,還是邊緣匯聚路由器或接入路由器大體由以下幾個部分組成:系統硬件、包括嵌入式操作系統及各種協議在內的軟件、網絡管理系統。網管系統也屬于軟件,與操作系統和協議軟件的區別是網管系統是路由器中的人機交互渠道,用戶通過網管系統控制整個路由器以及實現用戶所需的功能。由于路由器是由硬件和軟件組成的,因此,在設計路由器時,速度與可編程性是必須考慮的兩個重要因素。
到目前為止,路由器的發展過程大體經過了6種體系結構。早期路由器由通用CPU和共享總線相連接的線卡組成。所有從線卡進入系統的數據包通過共享總線送至處理器,由處理器處理數據,然后作出轉發的決定。隨后數據包再次通過共享總線送至目的線卡的接口,然后供傳輸到網絡的下一站或目的網絡。
隨著網絡速度的增加,共享總線結構不能令人滿意地按比例增加,成為ip數據網絡的瓶頸。為了緩解互連瓶頸,在線卡中增添了處理器,這些處理器就地處理、轉發大部分IP數據包,不再借助于主CPU,有效地將轉發功能分布到每塊線卡上。這樣,大部分數據至多通過共享總線一次而不是二次,從而減少了總線上的業務量。
隨著網絡速度的進一步增加,上述采用增加CPU的共享總線結構不能滿足實際的需要,開始涌現出新的系統,即以交換結構替代共享總線。交換結構以高出CPU幾個數量級的速度傳送IP數據包,而且可用分布式處理器進行處理,因而消除了互連瓶頸。
采用交換式結構,消除了互連瓶頸,但線卡處理器又成為新的瓶頸。于是出現了一種新方案,該方案采用了名為轉發引擎的專用CPU卡來處理和轉發IP數據包。在這類系統中,線卡僅發送信息包的報頭,通過交換結構傳送到轉發引擎,由它作出轉發決定,并將處理結果返回線卡。線卡再將IP包轉發至相應的輸出端口。在這個方案中,CPU僅處理一部分IP數據包,其余的數據包則直接通過高速交換結構從一個接口傳送至另一個接口。任何無須CPU干預、直接在接口間進行傳送的那部分IP包處于快速通路中,而任何需要CPU處理的IP包處于慢速通路中,慢速通路的數據包包括IP報頭、控制包和異常包。
盡管轉發引擎結構極大地提高了效率,但不斷增加的速度遠遠超過了通用CPU滿足該要求的能力,這樣就要求盡可能多地將數據傳入快速通路。于是,線卡上的通用CPU讓位給了高速、固定功能的ASIC。通過采用高速、專用ASIC,大大減少了CPU的負擔,這樣,大部分IP包完全可使用快速通路通過系統,只有控制包和異常包需經慢速通路轉發至CPU。但采用固定的ASIC,在提高效率的同時,付出的代價是降低通用CPU固有的可編程能力。在速度或可編程性兩方面難以適應IP網絡高速發展的要求。于是出現了一種名為網絡處理器(NPU)的器件,它既可用于線卡的快速通路中,類似于固定功能ASIC;又具有更高級的編程能力,類似于通用CPU的功能,它在速度和可編程方面都又優良的表現,大量采用高性能的網絡處理器是當前路由器的發展方向。
二、網絡處理器
不同的網絡處理器具有不同的速度、可編程性和功能。網絡處理器的基本功能是以線速轉發數據包。數據轉發功能包括分類與執行,分類指的是網絡處理器檢查數據包并確定如何進行處理和轉發的過程,而執行指網絡處理器按分類結果完成數據包的轉發過程。首先網絡處理器根據用戶編程規則對輸入的數據包進行封裝。其次,網絡處理器根據用戶可編程算法校正輸入的數據。第三,對數據包進行處理,根據有關協議規則轉發數據包。第四,網絡處理器提供用戶可編程的統計生成,以便跟蹤快速通路流量的分類結果。
網絡處理器具有下列數據通信功能。首先,它提供用戶可編程緩沖器管理,可根據緩沖器管理算法作出轉發/丟棄決定。其次,網絡處理器提供業務量整形功能,可根據調度算法調度數據包的傳輸。第三,網絡處理器能實現數據流修正。數據流修正包括數據流內的數據處理、報頭與報尾的增加或刪除,根據相關協議對數據進行封裝、分段。所有數據流修正單元都是完全可由用戶編程的。
目前,網絡處理器能夠處理的速率包括100Mbit/s以太網、GE、155Mbit/s、622Mbit/s、2.5Gbit/s和10Gbit/s POS的接口速率,而且可以保持線速轉發。目前,較流行的網絡處理器有:
Agere——Agere公司的NPU,包括快速圖形處理器(FPP),路由交換處理器(RSP),和Agere系統接口(ASI)。它是一種平臺處理器的解決方案,可以處理多項第二層的協議,處理速度可達OC-48的水平。Agere處理器的結構并不是依據RISC的構造,而是完全為分組處理應用重新設計的。
C-Port ( Motorola ) ——C-Port公司的C-5處理器,它有16個RISC芯核,32個串接數據處理器,和5個經過針對不同作業的需要,優化過了的處理器卸載。C-5可以執行第七層以下的分組分類作業,速度為5Gbit/s。
IBM已經開發了兩種平臺NPU。用于高端的NPU,命名為Rainier。Rainier的集成度很高,有16個RISC處理器芯核,和一個嵌入的MAC和/或POS成幀器。低端應用網絡處理器為Charm,它是以RISC為基礎的處理器,Charm是以企業的LAN和WAN接入作為應用對象。
其它網絡處理器包括Intel的IXP1200、Maker(Conexant)的MXT-4000系列和MXT-5000系列、Sitera公司的PRism、MMC的nP3400等。此外,市場上有些路由器中所用的網絡處理器是有關公司自行開發的。
三、高速路由器的關鍵技術
如前所述,路由器中包含了大量的協議軟件,路由器的各種功能都是通過有關協議來實現的,如將數據分組的IP協議,提供可靠數據傳輸的TCP協議,進行路由選擇的RIP、IGP、BGP、OSPF等。IP最初的思想是能夠實現各種物理網絡的無縫連接,因此,為了使IP數據能夠在各種物理網絡上傳輸IP數據,開發了相應的協議。由于IP是目前通信業務的主要增長點,而且IP也已經成為公認的未來通信的統一平臺,因此,作為IP網絡的核心設備的路由器中的關鍵技術之一是如何支持物理層中的光纖通信技術,為此開發了多種技術,這些技術的實現方式都是通過高速路由器中的有關線卡來實現的。
1.IP over ATM
路由器中IP over ATM是通過采用各種ATM線卡來實現的。IP over ATM的基本原理是將IP數據包在ATM層全部封裝為ATM信元,以ATM信元形式在信道中傳輸。當網絡中的交換機接收到一個IP數據包時,它首先根據IP數據包的IP地址通過某種機制進行路由地址處理,按路由轉發。隨后,按已計算的路由在ATM網上建立虛電路(VC)。以后的IP數據包將在此虛電路VC上以直通方式傳輸而下再經過路由器,從而有效地解決了IP的路由器的瓶頸問題,并將IP包的轉發速度提高到交換速度。IP over ATM技術的難點是如何將IP的無連接與ATM的面向連接到技術有機結合起來。IP over ATM技術眾多,可以分為兩種模型:重疊模型和集成模型。
2.IP over SDH
高速路由器中的IP over SDH(POS)是通過其上的POS線卡實現的。IP over SDH有兩種方式:一種是IETF定義的采用IP/PPP/HDLC/SDH結構的IP over SDH,另外一種為ITU-T X.86/Y.1321定義的采用IP/LAPS/SDH結構的POS。
IETF定義的POS的基本思路是將IP數據報通過點到點協議(PPP)直接映射到SDH幀,省掉了中間復雜的ATM層,這樣可大大節省網絡的投資。具體作法是先把IP數據報封裝進PPP,然后利用高層數據鏈路控制(HDLC)成幀,再將字節同步映射進虛容器(VC)包封中,最后加上相應的SDH開銷,置入STM-N幀內。在該方案中,PPP協議提供多協議封裝和差錯控制及鏈路初始化控制等功能,而HDLC幀格式負責同步傳輸鏈路上的PPP封裝的IP數據幀的定界。
IP/LAPS/SDH結構的POS是由武漢郵電科學研究院代表中國向ITU-T提出的,該方案兼容PPP,與IETF定義的POS相比,具有硬件開銷少,工作效率高等優點。
3.IP over WDM/Optical
IP over WDM基本原理和工作方式是在發送端將不同波長的光信號組合(復用)送入一根光纖中傳輸,在接收端,又將組合光信號分開(解復用)并送入不同終端。IP over WDM是一個真正的鏈路層數據網。高性能路由器通過光ADM或WDM耦合器直接連至WDM光纖,由它控制波長接入、交換、選路和保護。IP over WDM的幀結構有兩種形式:SDH幀格式和千兆以太網幀格式。
光纖通信能夠提供巨大的網絡帶寬,是所有網絡傳輸的基礎(有線傳輸)。在物理層采用光纖通信如WDM已經是人們的共識。同樣在第三層采用IP也是大勢所趨。由于傳統的光纖通信主要是為了解決電信網即采用TDM技術的電話網通信帶寬問題,隨著IP成為事實上的網絡統一標準地位的日益確定,自然就產生了一個問題是如何將IP和光路(Optical)有機地銜接起來,即實現IP over Optical(IPO)。目前國際上對IP over Optical的研究十分火熱,IETF成立了IPO工作組正在制定有關標準,IETF已經有多個相關的草案。IP over Optical的實現方式目前討論比較多的兩種方式是IP/MPλS /WDM以及IP/Digital Wrapper/WDM。其中WDM代表Optical,當然也可以是將來的OTDM的光纖通信技術。
IP over Optical的網絡模型,其中MPLS(Multi-Protocol Lambdas Switch)信號和路由選擇位于光網絡中。
在光網絡的路由和交換上使用MPLS,特別是以MPLS的方式來控制WDM/DWDM,以波長作為標簽,稱為多協議波長標簽交換(Multi-Protocol Lambda-label Switching:MPLmS)。MPLmS具有以下優勢:可以實現對光網絡帶寬的管理和對交換光網絡的光信道進行自動保護倒換;利用現有的MPLS和IP協議的軟、硬件資源以及應用經驗,避免開發新協議高投入的弊端;可以利用MPLS較為容易地實現流量工程,優化網絡性能;對光網絡單元和電(數據)網絡單元的互操作性標準協議的開發具有極大推進作用;通過光域和電域的規范統一的網絡管理和控制,簡化業務提供者需要進行的網絡管理工作;可以在IP路由器上最終實現DWDM復用,大大提高通信容量,為建立光因特網鋪平道路。
MPLmS網絡中,支持標簽交換的IP路由器(LSR)連接光核心網絡,光網絡由若干OXC通過光鏈路相互連接而成。OXC由光層面的交叉連接設備和控制平面組成,具有數據流交換功能,交換由可配置的交叉連接表控制。目前,OXC節點交換需要進行光電轉換,在電域進行。隨著光開關和可調諧激光器等技術的進步,將來它可以實現全光交換。控制平面使用基于IP的協議和信令進行節點的可達性檢測、控制建立和維護端到端的光通路。LSR的數據平面通過標簽互換實現標簽包的轉發,即通過各個LSR上“<{入端口,入標簽},{出端口,出標簽}>”的對應關系將打上標簽的包(FEC)映射到由這些標簽序列確定的標簽交換路徑上。而在OXC的數據平面上,也通過“<{入端口,入光信道},{出端口,出光信道}>”的對應關系將數據流映射到特定的光通路上。當使用WDM時,上述對應關系中的光信道即可由光波長來表示。OXC和LSR的控制平面都包括有資源發現、分布式路由選擇以及連接管理的功能:一個是發現、發布、維護關于OTN的狀態信息,根據光網絡流量工程的策略和規則建立和維護光通路;另一個則發現、發布、維護與MPLS相關的狀態信息,根據MPLS流量工程的策略和原則建立維護LSP。
4.EOS
EOS為Ethernet over SDH的縮寫。由于SDH和以太網分別為電信網和IP數據網(局域網)中占據了絕對優勢的技術,在向統一于IP的“三網合一”的下一代網絡演變的過程中,如何保護全世界原來的上千億美元的投資就顯得十分重要。此外,由于實際證明以太網是傳輸IP的最好技術之一,如何擴展以太網的傳輸距離也是一個重要的問題。目前ITU-T已經定義了一種EOS技術,該標準由武漢郵電科學研究院余少華博士提出,標準號為X.86。該技術有著廣泛的應用,既可在傳統的SDH設備中提供以太網接口,也可在傳統的以太網2/3層交換機中提供SDH接口,此外,還可以用一種設備直接將以太網和SDH兩大網絡連接起來。武漢郵電科學研究院開發的F-Engine AM1001 EOS接入設備就是這種設備。
新聞熱點
疑難解答