了解瞻博网络路由器的高可用性功能
对于运行Junos 操作系统 (Junos OS) 的瞻博网络路由平台而言, 高可用性 是指为基于数据包的通信提供冗余和可靠性的硬件和软件组件。本主题提供以下高可用性功能的简要概述:
路由引擎冗余
冗余路由引擎是安装在同一路由平台中的两个路由引擎。一个用作主路由引擎,而另一个则在主发生故障时作为备用。在具有双路由引擎的路由平台上,网络重新融合的速度比在具有单个路由引擎的路由平台上更快。
平滑路由引擎切换
平滑路由引擎切换 (GRES) 使具有冗余路由引擎的路由平台能够继续转发数据包,即使一个路由引擎发生故障也是如此。平滑路由引擎切换可保留接口和内核信息。流量不会中断。但是,平滑路由引擎切换不会保留控制平面。相邻路由器检测到路由器经历了重启,并以各个路由协议规范规定的方式对事件做出响应。
要在切换期间保留路由,平滑路由引擎切换必须与平稳重启协议扩展或 不间断活动路由相结合。有关更多信息,请参阅 了解平滑路由引擎切换 和 不间断活动路由概念。
在 T Series 路由器、TX Matrix 路由器和 TX Matrix Plus 路由器中,控制平面在使用 NSR 的 GRE 的情况下保留,并且在 GRES 期间,每个数据包转发引擎的 75% 的线速流量值保持不变。
不间断桥接
不间断桥接使具有冗余路由引擎的 MX 系列 5G 通用路由平台能够从主路由路由引擎切换到备用路由引擎,而不会丢失第 2 层控制协议 (L2CP) 信息。不间断桥接使用与平滑路由引擎切换相同的基础架构来保留接口和内核信息。但是,不间断桥接也可以通过在备份路由引擎上运行第 2 层控制协议进程 (l2cpd) 来保存 L2CP 信息。
要使用不间断桥接,必须先启用平滑路由引擎切换。
以下第 2 层控制协议支持不间断桥接:
生成树协议 (STP)
快速生成树协议 (RSTP)
多生成树协议 (MSTP)
VLAN 生成树协议 (VSTP)
有关详细信息,请参阅 不间断桥接概念。
不间断活动路由
不间断活动路由 (NSR) 使具有冗余路由引擎的路由平台能够从主路由路由引擎切换到备用路由引擎,而无需提醒对等节点发生了更改。不间断活动路由使用与平滑路由引擎切换相同的基础架构来保留接口和内核信息。但是,不间断活动路由也会通过在两个路由引擎上运行路由协议进程 (rpd) 来保留路由信息和协议会话。此外,不间断的活动路由会保留在内核中维护的 TCP 连接。
要使用不间断活动路由,还必须配置平滑路由引擎切换。
有关不间断活动路由支持的协议和功能列表,请参阅 不间断活动路由协议和功能支持。
有关不间断活动路由的详细信息,请参阅 不间断活动路由概念。
平滑重启
使用路由协议时,任何服务中断都需要受影响的路由器重新计算与相邻路由器的邻接关系,还原路由表条目,并更新其他特定于协议的信息。在未受保护的情况下重启路由器可能会导致转发延迟、路由抖动、协议重新融合导致的等待时间,甚至导致数据包丢失。为了缓解这种情况,平稳重启提供了对路由协议的扩展。这些协议扩展为路由器定义了两个角色:重新启动 和 助手。这些扩展程序向相邻路由器发出有关路由器即将重新启动的信号,并防止相邻路由器在正常重启等待间隔期间将状态更改传播到网络。平滑重启的主要好处是数据包转发不会中断,并暂时抑制所有路由协议更新。平滑重启使路由器能够通过对网络其余部分隐藏的中间融合状态。
当路由器正常运行,且路由器停止发送和回复协议活动消息(hellos)时,邻接将假定正常重新启动,并开始运行计时器来监控重新启动的路由器。在此期间,帮助路由器不会处理它们认为正在重新启动的路由器的邻接更改,而是继续与网络的其余部分进行活动路由。帮助路由器假定路由器可以根据重新启动期间最后保留的路由状态继续进行有状态转发。
如果路由器实际正在重新启动,并且在所有帮助路由器的平滑计时周期到期之前已备份,则帮助路由器会为路由器提供路由表、拓扑表或标签表(具体取决于协议),退出平滑周期,然后返回正常网络路由。
如果路由器未在所有帮助路由器的正常计时期到期之前完成与帮助路由器的协商,则帮助路由器将处理路由器的状态更改并发送路由更新,以便跨网络实现融合。如果帮助路由器检测到路由器出现链路故障,则拓扑更改会导致帮助路由器退出正常等待期并发送路由更新,从而实现网络融合。
要使路由器能够进行平滑重启,必须在全局[edit routing-options]
或[edit routing-instances instance-name routing-options]
层次结构级别包含graceful-restart
语句。您可以选择在单个协议级别修改全局设置。启动路由会话时,配置了平稳重启的路由器必须与邻接方协商,以便在平稳重启时为其提供支持。相邻路由器将接受协商和支持助手模式,而无需在相邻路由器上配置正常重启。
处于平滑等待状态的帮助程序路由器上的路由引擎切换事件会导致路由器丢弃等待状态,并将邻接的状态更改传播到网络。
以下协议和应用程序支持平滑重启:
边界网关协议
ES-IS
IS-IS
OSPF/OSPFv3
PIM 稀疏模式
RIP/RIPng
MPLS 相关协议,包括:
标签分发协议 (LDP)
资源预留协议 (RSVP)
电路交叉连接 (CCC)
转换交叉连接 (TCC)
第 2 层和第 3 层虚拟专用网络 (VPN)
有关详细信息,请参阅 平滑重启概念。
不间断活动路由与平稳重启
不间断活动路由和平稳重启是保持高可用性的两种不同方法。平滑重启需要路由器重启。进行平滑重启的路由器依靠其邻接方(或助手)来恢复其路由协议信息。重新启动是一种机制,通过该机制,帮助程序会收到退出等待间隔的信号,并开始向重新启动的路由器提供路由信息 有关详细信息,请参阅 平滑重启概念。
相比之下,不间断活动路由不涉及路由器重启。主路由引擎和备用路由引擎都在运行路由协议进程 (rpd),并与邻居交换更新。当一个路由引擎发生故障时,路由器只需切换到活动的路由引擎,即可与邻居交换路由信息。由于这些功能差异,不间断路由和平滑重启是相互排斥的。如果路由器配置为平稳重新启动的路由器,则无法启用不间断活动路由。如果在任何层次结构级别包含语句,在层次结构级别包含 graceful-restart
语 nonstop-routing
句 [edit routing-options]
并尝试提交配置,则提交请求将失败。有关详细信息,请参阅 不间断活动路由概念。
路由引擎切换的影响
路由引擎切换的效果介绍 在未启用高可用性功能以及启用平滑路由引擎切换、平稳重启和不间断活动路由功能时,路由引擎切换的效果。
VRRP
虚拟路由器冗余协议 (VRRP) 使 LAN 上的主机能够利用 LAN 上的冗余路由平台(主对和备份对),只需在主机上对单个默认路由进行静态配置。
VRRP 路由平台对共享与主机上配置的默认路由对应的 IP 地址。在任何时候,其中一个 VRRP 路由平台都是主(活动),而其他平台是备份。如果主路由器发生故障,其中一台备份路由器或交换机将成为新的主路由器。
VRRP 在易于管理、网络吞吐量和可靠性方面具有优势:
它提供了一个虚拟的默认路由平台。
它能够在没有单点故障的情况下路由 LAN 上的流量。
虚拟备份路由器可以接管发生故障的默认路由器:
几秒钟内即可完成。
以最小的 VRRP 流量实现
没有与主人的任何互动。
运行 VRRP 的设备可动态选择主路由器和备份路由器。您还可以使用 1 到 255 之间的优先级强制分配主路由器和备份路由器,其中 255 为最高优先级。
在 VRRP 操作中,默认主路由器定期(默认 1 秒)向备份路由器发送播发。如果备份路由器在设定的时间段内未收到播发,则优先级次高的备份路由器将接管主路由器,并开始转发数据包。
从 Junos OS 13.2 版开始,仅当在[edit routing-options]
或 [edit logical system logical-system-name routing-options]
层次结构级别配置nonstop-routing
语句时,才会启用 VRRP 不间断活动路由 (NSR)。
有关详细信息,请参阅 了解 VRRP。
统一 ISSU
统一不中断服务的软件升级(统一 ISSU)使您能够在两个不同的 Junos OS 版本之间进行升级,而不会中断控制平面,并且将流量中断降至最低。统一 ISSU 仅受双路由引擎平台支持。此外,还必须启用平滑路由引擎切换 (GRES) 和不间断活动路由 (NSR)。
借助统一的 ISSU,您可以消除网络停机时间、降低运维成本并提供更高级别的服务。有关详细信息,请参阅 统一不中断服务的软件升级入门。
用于使用虚拟机箱的 MX 系列路由器的机箱间冗余
机箱间冗余 是一项高可用性功能,可以跨越位于多个地理位置的设备,以防止网络中断,并保护路由器免受接入链路故障、上行链路故障和批发机箱故障的影响,而不会明显中断连接的用户或增加服务提供商的网络管理负担。随着网络上传输的高优先级语音和视频流量越来越多,机箱间冗余已成为在宽带用户管理设备(例如宽带服务路由器、宽带网络网关和宽带远程接入服务器)上提供有状态冗余的要求。机箱间冗余支持使服务提供商能够履行严格的服务水平协议 (SLA) 并避免计划外网络中断,从而更好地满足客户的需求。
要为 MX 系列 5G 通用路由平台提供有状态机箱间冗余解决方案,可以配置 虚拟机箱。 虚拟机箱 配置将两个 MX 系列路由器互连到一个逻辑系统中,您可以将其作为单个网络元素进行管理。虚拟机箱中的成员路由器被指定为 主路由器 (也称为 协议主路由器)和 备份路由器 (也称为 协议备份)。成员路由器通过您在 Trio 模块化端口集中器/模块化接口卡 (MPC/MIC) 接口上配置的专用 虚拟机箱端口 进行互连。
MX 系列虚拟机箱由虚拟机 箱控制协议 (VCCP) 管理,该协议是一种基于 IS-IS 的专用控制协议。VCCP 在 虚拟机箱 端口接口上运行,负责构建虚拟机箱拓扑、选择虚拟机箱主路由器以及建立机箱间路由表以在虚拟机箱内路由流量。
从 Junos OS 11.2 版开始,带有三个 MPC/MIC 接口和双路由引擎的 MX240、MX480 和 MX960 通用路由平台支持虚拟机箱配置。此外,必须在虚拟机箱中的两个成员路由器上启用平滑路由引擎切换 (GRES) 和不间断活动路由 (NSR)。
ACX7000 系列上特定于平台的高可用性行为
ACX7000 系列设备上的硬件架构与 PTX 和 MX 系列设备不同。在 PTX 和 MX 系列设备中,FPC 同时托管数据通路 PFE 以及面向 WAN 的端口 (PIC/MIC)。在 PTX 和 MX 系列设备中,每个 FPC 均设计为包含用于管理 FPC 组件的 CPU 计算资源。
在ACX7000系列设备上,转发引擎板 (FEB) FRU 仅包含 PFE 复合体,而路由引擎包含 CPU 计算复合体。路由引擎 FRU 同时执行路由引擎和线卡应用程序。
下表显示了ACX7000系列设备支持的高可用性属性和功能:
高可用性属性和功能 |
ACX7509 |
ACX7348 |
---|---|---|
控制平面 (RE) 冗余 |
是的 |
是的 |
数据平面 (PFE) 冗余 |
是的 |
不 |
GRES+GR |
是的 |
是的 |
GRES+NSR |
是的 |
是的 |
在 ACX7348 上,如果在路由引擎切换期间更改当前流或引入新流,则在切换完成之前不会发生融合。切换期间的拓扑更改仅在切换后应用。切换期间,预计会出现流量丢失和轻微统计信息丢失。
默认情况下,GRES 在 Junos Evolved 操作系统上处于启用状态,并且无法禁用
要在切换期间保留路由,GRES 必须与以下任一结合:
- 平滑重启 (GR) 协议扩展
- 不间断活动路由 (NSR) 和不间断桥接 (NSB)
在ACX7348设备上,如果在切换期间检测到属于宽带网络网关 (BNG)、VXLAN、sFlow、J 流和端口镜像等功能路由引擎配置,则数据路径将被重置,并重新融合流量。
在从主路由引擎发出任何切换命令之前,请使用备份路由引擎上的 show system switchover 命令检查备份路由引擎的状态。如果切换状态为就绪,则发出切换命令。
即使备份路由引擎尚未就绪,也可以发出切换命令。在这种情况下,路由引擎将切换主路由引擎(即使备份尚未就绪),并且系统行为不确定。
路由引擎切换会导致在切换时间内统计损失核算。
ACX7509支持路由引擎冗余,如下表所述:
系统配置 |
冗余 |
---|---|
单 RE / 单 FEB |
不適用。系统在非冗余模式下工作 |
双 RE / 双 FEB |
支持 |
双 RE / 单 FEB |
不支持。系统在非冗余模式下工作 |
单 RE / 双 FEB |
不支持。系统在非冗余模式下工作 |
计时协议不支持高可用性。因此,计时应用程序将仅在活动的主路由引擎上运行,而不会在备份路由引擎上运行。计时应用程序在路由引擎切换时重新启动。在路由引擎切换期间,无论是平滑还是非平滑 RE 切换,PTP、GM 和 SYNCE 都将失去锁定,并且盒子将进入 FREERUN 状态。硬件中的 PTP 数据包路径将被破坏。所有下游设备都将切换到网络中的备用主设备。如果没有备用主设备,则所有下游设备都将进入 HOLDOVER 状态。
在ACX7348设备上,如果按主路由引擎的“联机/脱机”按钮,则会正常切换到备份路由引擎。在路由引擎 LED 熄灭后,您可以安全地移除路由引擎卡。按备份路由引擎上的联机/脱机按钮对主路由引擎没有影响。