了解平滑路由引擎切换
本主题包含以下部分:
平滑路由引擎切换概念
Junos OS 和 Junos OS 演化版中的平滑路由引擎切换 (GRES) 功能使具有冗余路由引擎的路由器能够继续转发数据包,即使一个路由引擎出现故障。GRES 会保留接口和内核信息。流量不会中断。但是,GRES 不会保留控制平面。
在运行 Junos OS 演化版的 PTX10004、PTX10008 和 PTX10016 平台上,GRES 默认处于启用状态,无法禁用。
在 T 系列路由器、TX Matrix 路由器和 TX Matrix Plus 路由器上,如果具有不间断活动路由 (NSR) 的 GRES,控制平面会保留,而且每个数据包转发引擎近 75% 的线速流量在 GRES 期间保持不中断。
相邻路由器会检测到路由器重新启动,并按个别路由协议规范规定的方式对事件做出反应。
要在切换期间保留路由,GRES 必须与:
平滑重启协议扩展
不间断活动路由 (NSR)
对主路由引擎的任何更新一旦发生,就会复制到备份路由引擎。
由于其同步要求和逻辑,NSR/GRES 性能受系统中最慢的路由引擎的限制。
在以下情况中,主角色会切换到备份路由引擎:
主路由引擎内核停止运行。
主路由引擎遇到硬件故障。
管理员启动手动切换。
如果备份路由引擎在 2 秒(在 M20 路由器上为 4 秒)后未收到来自主路由引擎的激活信息,则确定主路由引擎出现故障:并承担主要角色
数据包转发引擎:
与旧主路由引擎无缝断开连接
重新连接到新的主路由引擎
不重新启动
不会中断流量
然后,新的主路由引擎和数据包转发引擎将同步。如果新的主路由引擎检测到数据包转发引擎状态不是最新的,它将重新发送状态更新消息。
从 Junos OS 12.2 版开始,如果重新启动路由器与相邻的对等方“帮助者”路由器之间的邻接超时,则平滑重启协议扩展无法通知对等“帮助者”路由器即将重新启动。然后,平稳重启可以停止流量并造成流量中断。
为了确保这些邻接得到维护,将 hold-time
IS-IS 协议从默认的 27 秒更改为高于 40 秒的值。
在两个路由引擎出现后,连续路由引擎切换事件之间的间隔必须至少为 240 秒(4 分钟)。
如果路由器或交换机显示类似 Standby Routing Engine is not ready for graceful switchover. Packet Forwarding Engines that are not ready for graceful switchover might be reset
警告消息,请勿尝试切换。如果您选择继续切换,则只会重置尚未做好正常切换准备的数据包转发引擎。FPC 都不应自发重启。建议等待警告不再出现,然后进行切换。
从 Junos OS 14.2 版开始,当您在 MX 系列路由器上执行 GRES 时,您必须对新的主路由引擎执行 clear synchronous-ethernet wait-to-restore
操作模式命令,以清除其上的等待恢复计时器。这是因为 clear synchronous-ethernet wait-to-restore
操作模式命令仅在本地路由引擎上清除等待恢复计时器。
在具有 3D SIB 的 TX Matrix Plus 路由器的路由矩阵中,对于连续路由引擎切换,在两个路由引擎出现后,事件间隔必须至少为 900 秒(15 分钟)。
一次必须在一个线卡机箱 (LCC)(具有 3D SIB 的 TX Matrix 路由器)上执行 GRES,以避免同步问题。
建议 不要 在路由器或交换机上启用 GRES 时对备份路由引擎执行提交操作。
我们不建议在任何情况下在备份路由引擎上启用 GRES。
在 QFX10000 交换机上[edit routing-options]
,强烈建议使用 GRES 启用不间断路由时,在层次结构级别配置nsr-phantom-holdtime seconds
语句。这样做有助于防止流量丢失。配置此语句时,切换期间,幻像 IP 地址会保留在内核中,直到指定的保留间隔到期。间隔到期后,这些路由会添加到相应的路由表中。在以太网 VPN (EVPN)/VXLAN 环境中,我们建议将暂侯时间值指定为 300 秒(5 分钟)。
图 1 显示了平滑路由引擎切换的系统架构,以及路由平台为切换做好准备的过程。
同时执行两项任务,检查 GRES 就绪情况:
来自
request chassis routing-engine master switch check
主路由引擎的命令show system switchover
来自备份路由引擎的命令
GRES 的切换准备过程如下:
主路由引擎启动。
路由平台进程(如机箱进程 [机箱d])启动。
数据包转发引擎启动并连接到主路由引擎。
系统会更新所有状态信息。
备份路由引擎启动。
系统确定是否已启用 GRES。
内核同步过程 (ksyncd) 将备份路由引擎与主路由引擎同步。
ksyncd 完成同步后,将更新所有状态信息和转发表。
图 2 显示了切换对路由(或交换)平台的影响。
切换过程包括以下步骤:
当来自主路由引擎的保持状态丢失时,系统会平稳地切换到备份路由引擎。
数据包转发引擎连接到成为新的主路由引擎的备份路由引擎。
不是 GRES 一部分的路由平台进程(例如路由协议进程 rpd)重新启动。
从切换点获悉的状态信息会更新系统中。
如果配置了,平滑重启协议扩展会从相邻的对等 助手 路由器收集并还原路由信息。
对于使用增强型订阅者管理的 MX 系列路由器,在执行平稳的路由引擎切换时,新的备份路由引擎(原主路由引擎)将重新启动。此冷重启会将备份路由引擎状态与新主路由引擎的状态重新同步,防止切换期间可能出现的状态差异。
在 GRES 期间,T 系列和 M320 路由器上的 GRES 期间,交换接口板 (SIB) 将脱机并逐个重新启动。这样做是为了向管理 SIB 的交换机处理器夹层板 (SPMB) 提供足够的时间来为其关联的 SIB 填充状态信息。但是,在所有 FPC 均以全线速发送流量的完全填充的机箱上,切换期间可能出现暂时的丢包情况。
配置 GRES 并在 restart chassis-control
具有 3D SIB 的 TX Matrix Plus 路由器上执行命令时,您无法确定哪个路由引擎成为主要路由引擎。这是因为执行命令后,机箱进程会重新启动 restart chassis-control
。机箱进程负责维护和保留主要角色,重新启动时,将根据路由器或交换机负载处理新机箱。因此,任何一个路由引擎都成为主要路由引擎。
路由引擎切换的影响
表 1 介绍了启用不同功能时路由引擎切换的效果:
无高可用性功能
平滑路由引擎切换
平滑重启
不间断活动路由
特征 |
好处 |
考虑 |
---|---|---|
仅双路由引擎(未启用任何功能) |
|
|
支持 GRES |
|
|
支持 GRES 和 NSR |
|
|
启用了 GRES 和 平稳重启 |
|
|
聚合服务接口上的平滑路由引擎切换
如果由操作模式命令触发平稳的路由引擎切换 (GRES),则聚合服务接口 (ASI) 的状态不会保留。例如:
request interface <switchover | revert> asi-interface
但是,如果 CLI 提交、FPC 重新启动或崩溃触发了 GRES,则备份路由引擎会更新 ASI 状态。例如:
set interface si-x/y/z disable commit
或:
request chassis fpc restart
clear synchronous-ethernet wait-to-restore
操作模式命令,以清除其上的等待恢复计时器。