眾所周知,要獲得很高的網絡永續性,需要使用具有熱故障恢復功能和連接不同網絡路徑的主路由器和備用路由器。但是僅僅這樣并不夠。路由器本身——尤其是那些位于不安全的 WAN 邊緣的路由器——應當配有內部冗余硬件組件,例如交換矩陣、線路卡、電源和路由處理器( RP )。高可用性路由器還必須支持快速軟件恢復技術。
利用可以隔離控制和轉發面板,并使用平穩的重啟機制——也被稱為思科不間斷轉發( NSF )——的路由器,可以大幅度地延長網絡和應用的正常運行時間。這種軟件恢復技術可以在 RP 流程發生中斷時,保持分組的正常傳輸,從而控制中斷對網絡的影響。
雙 RP 和連續分組轉發
RP 包含了路由器的“大腦”。它負責存儲最佳路徑路由信息的數據庫,保存與對等路由器的鄰接關系,以及處理特定的治理職能。冗余硬件可以提高網絡組件在發生故障時的可用性。思科的雙 RP 設備包括 12000 、 10000 和 7600 系列高端路由器,以及 Cisco 7500 和 7300 系列路由器。
兩個 RP 的狀態信息的同步程度在一定程度上將取決于路由器能夠以多快的速度從進程重啟或者從故障中恢復。這需要在兩個極端的備份形式之間進行平衡。一種極端形式是 RP 的“冷”備份,即不包含任何關于第二層連接、鄰接關系和最佳路徑路由表的狀態信息。在這種情況下,所有這些信息都需要重新構建,因而可能會導致極長的恢復時間。另外一種極端形式是在兩個 RP 之間不間斷地同步所有的信息,這可能會占用過多的處理資源,影響到網絡的可擴展性和性能。
通常采用的方式是在這兩種極端的 RP 同步方式之間保持適當的平衡,即將大部分(但并非全部)恢復信息加載到備用 RP 中。這種同步可以在切換 RP 和集中路由表的過程中,繼續進行第三層分組轉發。
安裝在上述路由器平臺上的 Cisco IOS?軟件 12.0(22)S 版本或者更高版本可以支持思科 NSF 。它能在主 RP 進行預定維護或者 RP 發生意外故障時縮短路由器的停機時間。在大多數情況下,要實現思科 NSF ,重啟路由器和它的對等路由器必須保存針對所有可以通過重啟路由器到達的網絡的轉發信息。在重啟路由器上,在從主 RP 向備用 RP 切換的過程中,控制面板和轉發面板必須互相隔離,以便讓轉發面板能繼續轉發數據流量。
要讓大部分思科 NSF/ 平穩重啟部署可以發揮作用,重啟路由器的對等路由器也必須支持這些擴展。這主要是由于下面兩點原因。首先, RP 切換并不代表拓撲變化,僅僅表示 RP 恢復。對等路由器可以利用平穩重啟擴展區別這兩種情況,從而避免對外廣播停用和啟用重啟路由器的信息。這可以防止不必要的廣播信息和路由變化。其次,它讓對等路由器能在恢復期間繼續向重啟路由器轉發分組,從而提供 NSF 。它還必須知道應當交換哪些消息和信息,以幫助主路由器迅速恢復。