Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

了解平滑路由引擎切换

本主题包含以下部分:

平滑路由引擎切换概念

Junos OS 和 Junos OS 演化版中的平滑路由引擎切换 (GRES) 功能使具有冗余路由引擎的路由器能够继续转发数据包,即使一个路由引擎出现故障。GRES 会保留接口和内核信息。流量不会中断。但是,GRES 不会保留控制平面。

注意:

在运行 Junos OS 演化版的 PTX10004、PTX10008 和 PTX10016 平台上,GRES 默认处于启用状态,无法禁用。

注意:

在 T 系列路由器、TX Matrix 路由器和 TX Matrix Plus 路由器上,如果具有不间断活动路由 (NSR) 的 GRES,控制平面会保留,而且每个数据包转发引擎近 75% 的线速流量在 GRES 期间保持不中断。

相邻路由器会检测到路由器重新启动,并按个别路由协议规范规定的方式对事件做出反应。

要在切换期间保留路由,GRES 必须与:

  • 平滑重启协议扩展

  • 不间断活动路由 (NSR)

对主路由引擎的任何更新一旦发生,就会复制到备份路由引擎。

注意:

由于其同步要求和逻辑,NSR/GRES 性能受系统中最慢的路由引擎的限制。

在以下情况中,主角色会切换到备份路由引擎:

  • 主路由引擎内核停止运行。

  • 主路由引擎遇到硬件故障。

  • 管理员启动手动切换。

注意:

要在切换期间快速还原或保留路由协议状态信息,GRES 必须分别与平滑重启或不间断活动路由相结合。有关平稳重启的更多信息,请参阅 平滑重启概念。有关不间断主动路由的更多信息,请参阅 不间断主动路由概念

如果备份路由引擎在 2 秒(在 M20 路由器上为 4 秒)后未收到来自主路由引擎的激活信息,则确定主路由引擎出现故障:并承担主要角色

数据包转发引擎:

  • 与旧主路由引擎无缝断开连接

  • 重新连接到新的主路由引擎

  • 不重新启动

  • 不会中断流量

然后,新的主路由引擎和数据包转发引擎将同步。如果新的主路由引擎检测到数据包转发引擎状态不是最新的,它将重新发送状态更新消息。

注意:

从 Junos OS 12.2 版开始,如果重新启动路由器与相邻的对等方“帮助者”路由器之间的邻接超时,则平滑重启协议扩展无法通知对等“帮助者”路由器即将重新启动。然后,平稳重启可以停止流量并造成流量中断。

为了确保这些邻接得到维护,将 hold-time IS-IS 协议从默认的 27 秒更改为高于 40 秒的值。

注意:

在两个路由引擎出现后,连续路由引擎切换事件之间的间隔必须至少为 240 秒(4 分钟)。

如果路由器或交换机显示类似 Standby Routing Engine is not ready for graceful switchover. Packet Forwarding Engines that are not ready for graceful switchover might be reset 警告消息,请勿尝试切换。如果您选择继续切换,则只会重置尚未做好正常切换准备的数据包转发引擎。FPC 都不应自发重启。建议等待警告不再出现,然后进行切换。

注意:

从 Junos OS 14.2 版开始,当您在 MX 系列路由器上执行 GRES 时,您必须对新的主路由引擎执行 clear synchronous-ethernet wait-to-restore 操作模式命令,以清除其上的等待恢复计时器。这是因为 clear synchronous-ethernet wait-to-restore 操作模式命令仅在本地路由引擎上清除等待恢复计时器。

注意:

在具有 3D SIB 的 TX Matrix Plus 路由器的路由矩阵中,对于连续路由引擎切换,在两个路由引擎出现后,事件间隔必须至少为 900 秒(15 分钟)。

一次必须在一个线卡机箱 (LCC)(具有 3D SIB 的 TX Matrix 路由器)上执行 GRES,以避免同步问题。

注意:
  • 建议 不要 在路由器或交换机上启用 GRES 时对备份路由引擎执行提交操作。

  • 我们不建议在任何情况下在备份路由引擎上启用 GRES。

注意:

在 QFX10000 交换机上[edit routing-options],强烈建议使用 GRES 启用不间断路由时,在层次结构级别配置nsr-phantom-holdtime seconds语句。这样做有助于防止流量丢失。配置此语句时,切换期间,幻像 IP 地址会保留在内核中,直到指定的保留间隔到期。间隔到期后,这些路由会添加到相应的路由表中。在以太网 VPN (EVPN)/VXLAN 环境中,我们建议将暂侯时间值指定为 300 秒(5 分钟)。

图 1 显示了平滑路由引擎切换的系统架构,以及路由平台为切换做好准备的过程。

图 1:为平滑路由引擎切换 Preparing for a Graceful Routing Engine Switchover做好准备
注意:

同时执行两项任务,检查 GRES 就绪情况:

  • 来自 request chassis routing-engine master switch check 主路由引擎的命令

  • show system switchover来自备份路由引擎的命令

GRES 的切换准备过程如下:

  1. 主路由引擎启动。

  2. 路由平台进程(如机箱进程 [机箱d])启动。

  3. 数据包转发引擎启动并连接到主路由引擎。

  4. 系统会更新所有状态信息。

  5. 备份路由引擎启动。

  6. 系统确定是否已启用 GRES。

  7. 内核同步过程 (ksyncd) 将备份路由引擎与主路由引擎同步。

  8. ksyncd 完成同步后,将更新所有状态信息和转发表。

图 2 显示了切换对路由(或交换)平台的影响。

图 2:平滑路由引擎切换过程 Graceful Routing Engine Switchover Process

切换过程包括以下步骤:

  1. 当来自主路由引擎的保持状态丢失时,系统会平稳地切换到备份路由引擎。

  2. 数据包转发引擎连接到成为新的主路由引擎的备份路由引擎。

  3. 不是 GRES 一部分的路由平台进程(例如路由协议进程 rpd)重新启动。

  4. 从切换点获悉的状态信息会更新系统中。

  5. 如果配置了,平滑重启协议扩展会从相邻的对等 助手 路由器收集并还原路由信息。

注意:

对于使用增强型订阅者管理的 MX 系列路由器,在执行平稳的路由引擎切换时,新的备份路由引擎(原主路由引擎)将重新启动。此冷重启会将备份路由引擎状态与新主路由引擎的状态重新同步,防止切换期间可能出现的状态差异。

注意:

在 GRES 期间,T 系列和 M320 路由器上的 GRES 期间,交换接口板 (SIB) 将脱机并逐个重新启动。这样做是为了向管理 SIB 的交换机处理器夹层板 (SPMB) 提供足够的时间来为其关联的 SIB 填充状态信息。但是,在所有 FPC 均以全线速发送流量的完全填充的机箱上,切换期间可能出现暂时的丢包情况。

注意:

配置 GRES 并在 restart chassis-control 具有 3D SIB 的 TX Matrix Plus 路由器上执行命令时,您无法确定哪个路由引擎成为主要路由引擎。这是因为执行命令后,机箱进程会重新启动 restart chassis-control 。机箱进程负责维护和保留主要角色,重新启动时,将根据路由器或交换机负载处理新机箱。因此,任何一个路由引擎都成为主要路由引擎。

路由引擎切换的影响

表 1 介绍了启用不同功能时路由引擎切换的效果:

  • 无高可用性功能

  • 平滑路由引擎切换

  • 平滑重启

  • 不间断活动路由

表 1:路由引擎切换的影响

特征

好处

考虑

仅双路由引擎(未启用任何功能)

  • 完成对新主路由引擎的切换后,将进行路由融合并恢复流量。

  • 所有物理接口均脱机。

  • 数据包转发引擎重新启动。

  • 备份路由引擎重新启动路由协议进程 (rpd)。

  • 所有硬件和接口均由新的主路由引擎发现。

  • 切换需要几分钟时间。

  • 路由器的所有邻接都可以识别物理(接口告警)和路由(拓扑)更改。

支持 GRES

  • 切换期间,接口和内核信息将保留。

  • 由于数据包转发引擎不会重新启动,因此切换速度更快。

  • 新的主路由引擎将重新启动路由协议进程 (rpd)。

  • 所有硬件和接口都通过类似于暖重启的过程获得。

  • 所有邻接都了解路由器的状态变化。

支持 GRES NSR

  • 切换期间流量不会中断。

  • 接口和内核信息将保留。

  • 必须使用每个协议固有的正常恢复机制刷新不受支持的协议。

启用了 GRES 平稳重启

  • 切换期间流量不会中断。

  • 接口和内核信息将保留。

  • 平滑重启协议扩展可从相邻路由器快速收集并恢复路由信息。

  • 需要邻接方才能支持平稳重启,需要有一个等待间隔。

  • 路由协议进程 (rpd) 重新启动。

  • 对于某些协议,网络的重大变化可能导致正常停止重启。

  • 从 Junos OS 12.2 版开始,如果重新启动的路由器与相邻的对等方“帮助程序”路由器之间的邻接超时,则平滑重启可以停止并导致流量中断。

聚合服务接口上的平滑路由引擎切换

如果由操作模式命令触发平稳的路由引擎切换 (GRES),则聚合服务接口 (ASI) 的状态不会保留。例如:

但是,如果 CLI 提交、FPC 重新启动或崩溃触发了 GRES,则备份路由引擎会更新 ASI 状态。例如:

或:

版本历史记录表
释放
描述
14.2
从 Junos OS 14.2 版开始,当您在 MX 系列路由器上执行 GRES 时,您必须对新的主路由引擎执行 clear synchronous-ethernet wait-to-restore 操作模式命令,以清除其上的等待恢复计时器。
12.2
从 Junos OS 12.2 版开始,如果重新启动路由器与相邻的对等方“帮助者”路由器之间的邻接超时,则平滑重启协议扩展无法通知对等“帮助者”路由器即将重新启动。
12.2
从 Junos OS 12.2 版开始,如果重新启动的路由器与相邻的对等方“帮助程序”路由器之间的邻接超时,则平滑重启可以停止并导致流量中断。