Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

了解路由引擎冗余

总结 路由引擎冗余可确保网络持续正常运行。如果主路由引擎脱机(通过故障转移或切换),备用路由引擎将接管所有路由功能。

路由引擎冗余概述

冗余路由引擎是安装在同一路由平台中的两个路由引擎。其中一个充当主路由引擎,另一个则作为备份,如果主路由引擎出现故障。在具有双路由引擎的路由平台上,网络重新融合的速度比在具有单一路由引擎的路由平台上发生得更快。

将路由引擎配置为主路由引擎时,它具有全部功能。它接收和传输路由信息,构建和维护路由表,与接口和数据包转发引擎组件通信,并完全控制机箱。将路由引擎配置为备份时,它不会与数据包转发引擎或机箱组件进行通信。

注意:

在运行 Junos OS 8.4 或更高版本的设备上,两个路由引擎不能同时配置为主路由引擎。此配置会导致提交检查失败。

当主路由引擎遇到硬件故障或者已将软件配置为支持基于特定条件的主角色更改时,会自动从主路由引擎到备份路由引擎的故障转移。您还可以通过发出其中 request chassis routing-engine 一个命令来手动切换路由引擎的主角色。在本主题中, 术语故障切换 是指自动事件,而 切换 是指自动事件或手动事件。

发生故障转移或切换时,备份路由引擎会将系统的控制权作为新的主路由引擎。

  • 如果未配置 平滑路由引擎切换 ,当备份路由引擎成为主路由引擎时,它将重置交换机平面,并将自己的微内核版本下载到数据包转发引擎组件。数据包转发引擎重新初始化时流量被中断。所有内核和转发进程都已重新启动。

  • 如果配置了平滑路由引擎切换,则接口和内核信息将保留。由于数据包转发引擎不会重新启动,因此切换速度更快。新的主路由引擎将重新启动路由协议进程 (rpd)。所有硬件和接口都通过类似于暖重启的过程获得。

  • 如果配置了平滑路由引擎切换和 不间断活动路由 (NSR),则流量不会在切换期间中断。接口、内核和路由协议信息将保留。

  • 如果配置了平滑路由引擎切换和平稳重启,则流量不会在切换期间中断。接口和内核信息将保留。平滑重启协议扩展可从相邻路由器快速收集并恢复路由信息。

触发路由引擎故障切换的情况

以下事件可能会导致路由引擎的主要角色自动更改,具体取决于您的配置:

  • 路由平台遇到硬件故障。如果路由引擎或关联的主机模块或子系统突然关闭,路由引擎主角色将发生变化。您还可以将备份路由引擎配置为在检测到主路由引擎上的硬盘错误时担任主要角色。要启用此功能,请将语句failover on-disk-failure[edit chassis redundancy]包含在层次结构级别。

  • 路由平台遇到软件故障,例如内核崩溃或 CPU 锁定。您必须配置备份路由引擎,使其在检测到激活信号丢失时发挥主要作用。要启用此故障切换方法,请将语句 failover on-loss-of-keepalives 包含在 [edit chassis redundancy] 层次结构级别。

  • 路由平台在主路由引擎上遇到 em0 接口故障。您必须将备份路由引擎配置为在检测到 em0 接口故障时担任主要角色。要启用此故障切换方法,请将语句 on-re-to-fpc-stale 包含在 [edit chassis redundancy failover] 层次结构级别。

  • 特定软件进程失败。您可以将备份路由引擎配置为在 30 秒内一个或多个指定进程至少四次失败时担任主要角色。在 failover other-routing-engine 层次结构级别包括语句 [edit system processes process-name]

如果满足其中任何一个条件,将记录一条消息,并尝试由备份路由引擎担任主要角色。默认情况下,当备份路由引擎处于活动状态时,将生成告警。备份路由引擎成为主要角色后,即使在最初配置的主路由引擎成功恢复操作之后,它也会继续作为主路由引擎运行。您必须手动将其恢复到之前的备份状态。(但是,如果任何时候有一个路由引擎不存在,则另一个路由引擎会自动成为主路由引擎,而不管冗余的配置方式如何。)

默认路由引擎冗余行为

默认情况下,Junos OS 使用 re0 作为主路由引擎, re1 用作备份路由引擎。除非配置中另有指定,否则当重新启动起作用的主路由引擎时 ,re0 始终成为主要路由引擎。

注意:

机箱中的单个路由引擎始终成为主路由引擎,即使它以前是备份路由引擎。

执行以下步骤,了解默认路由引擎冗余设置的工作原理:

  1. 确保 re0 是主要路由引擎。

  2. 通过从主路由引擎发出 request chassis routing-engine master switch 命令,手动切换路由引擎主要角色的状态。 re0 是备份路由引擎, re1 是主路由引擎。

    注意:

    下次主路由引擎重新启动时,Junos OS 将路由器返回到默认状态,因为您尚未配置路由引擎以在重新启动后保持此状态。

  3. 重新启动主路由引擎 re1

    路由引擎启动并读取配置。由于您未在配置中指定哪个路由引擎为主要路由引擎, 因此 re1 使用默认配置作为备份。现在 ,re0re1 都处于备份状态。Junos OS 会检测到此冲突,为了防止出现无主状态,会恢复到默认配置,以便将 re0 定向为主配置。

TX Matrix 路由器上的路由引擎冗余

在路由矩阵中,TX Matrix 路由器和所连接的 T640 路由器中的所有主路由引擎都必须运行相同的 Junos OS 版本。同样,路由矩阵中的所有备份路由引擎都必须运行相同的 Junos OS 版本。在路由矩阵中的所有主路由引擎和备份路由引擎上运行相同的 Junos OS 版本时,路由矩阵中任何备份路由引擎的主角色更改不会导致路由矩阵中任何其他机箱的主角色发生变化。

谨慎:

(仅基于 TX Matrix 或 TX Matrix Plus 路由器的路由矩阵)在路由矩阵中,建议所有路由引擎都运行同一个 Junos OS 版本。如果在路由引擎上运行不同版本,且在基于 TX Matrix 路由器或 TX Matrix Plus 路由器的路由矩阵中的任何备份路由引擎上发生主要角色更改,则一台或所有路由器可能会在逻辑上与 TX Matrix 路由器或 TX Matrix Plus 路由器断开连接,并导致数据丢失。

如果路由矩阵中的所有主路由引擎和备份路由引擎均未在相同的 Junos OS 版本上运行,则当层次结构级别包含[edit chassis redundancy]failover on-loss-of-keepalives语句is时,将发生以下后果:

  • failover on-loss-of-keepalives如果语句包含在[edit chassis redundancy]层次结构级别中,并且您或主机子系统开始对 TX Matrix 路由器中的备份路由引擎的主要角色更改,则 T640 路由器中的主路由引擎会检测到软件版本不匹配,与 TX Matrix 路由器中的新主路由引擎不匹配,并将主要角色切换为其备份路由引擎。

  • 使用 request chassis routing-engine master 命令将主要角色手动更改为 T640 路由器中的备份路由引擎时,T640 路由器中的新主路由引擎会检测到软件版本与 TX Matrix 路由器中的主路由引擎不匹配,并将主要角色让给原始主路由引擎。(在这种情况下,TX Matrix 路由器中的路由引擎主要角色不会切换。)

  • 由于主路由引擎出现故障,主机子系统开始将 T640 路由器中的备份路由引擎的主要角色更改为,则 T640 路由器在逻辑上与 TX Matrix 路由器断开连接。要重新连接 T640 路由器,请将主要角色更改为 TX Matrix 路由器中的备份路由引擎,或者将 T640 路由器中出现故障的路由引擎和交换机主角色替换为该路由器。更换的路由引擎必须与 TX Matrix 路由器中的主路由引擎运行相同的软件版本。

如果路由矩阵中的所有主路由引擎和备份路由引擎均未在相同的 Junos OS 版本上运行,则当层次结构级别包含[edit chassis redundancy]failover on-loss-of-keepalives语句is not时,将发生以下后果:

  • 如果开始更改 TX Matrix 路由器中的备份路由引擎的主要角色,则所有 T640 路由器在逻辑上都与 TX Matrix 路由器断开连接。要重新连接 T640 路由器,请将 T640 路由器中所有主要路由引擎的主要角色切换到其备份路由引擎。

  • 如果开始更改 T640 路由器中的备份路由引擎的主要角色,则 T640 路由器在逻辑上会与 TX Matrix 路由器断开连接。要重新连接 T640 路由器,请将 T640 路由器中新主路由引擎的主角色切换回原始主路由引擎。

TX Matrix Plus 路由器上的路由引擎冗余

在路由矩阵中,TX Matrix Plus 路由器和所连接的 LCC 中的所有主路由引擎都必须运行同一个 Junos OS 版本。同样,路由矩阵中的所有备份路由引擎都必须运行相同的 Junos OS 版本。在路由矩阵中的所有主路由引擎和备份路由引擎上运行相同的 Junos OS 版本时,路由矩阵中任何备份路由引擎的主角色更改不会导致路由矩阵中任何其他机箱的主角色发生变化。

谨慎:

(仅基于 TX Matrix 或 TX Matrix Plus 路由器的路由矩阵)在路由矩阵中,建议所有路由引擎都运行同一个 Junos OS 版本。如果在路由引擎上运行不同版本,并且路由矩阵中基于 TX Matrix 路由器或 TX Matrix Plus 路由器的任何备份路由引擎上发生了主要角色的更改,则一台或所有路由器可能会在逻辑上与 TX Matrix Matrix Plus 路由器断开连接,并导致数据丢失。

如果路由矩阵中的所有主路由引擎和备份路由引擎均未在相同的 Junos OS 版本上运行,则当在层次结构级别包含[edit chassis redundancy]failover on-loss-of-keepalives语句is时,将发生以下情况:

  • 当该 failover on-loss-of-keepalives 语句包含在 [edit chassis redundancy] 层次结构级别中,并且您或主机子系统对 TX Matrix Plus 路由器中的备份路由引擎发起主要角色更改时,所连接 LCC 中的主路由引擎会检测到软件版本不匹配,与 TX Matrix Plus 路由器中的新主路由引擎不匹配,并将主要角色切换至其备份路由引擎。

  • 使用命令将主要角色手动更改为连接 LCC 中的备份路由引擎时,连接 LCC request chassis routing-engine master 中的新主路由引擎会检测到软件版本与 TX Matrix Plus 路由器中的主路由引擎不匹配,并将主要角色放弃给原始主路由引擎。(在这种情况下,TX Matrix Plus 路由器中的路由引擎主要角色不会切换。)

  • 当主机子系统由于主路由引擎故障而启动对连接的 LCC 中的备份路由引擎的主要角色更改时,连接的 LCC 在逻辑上会与 TX Matrix Plus 路由器断开连接。要重新连接连接的 LCC,请将主要角色更改为 TX Matrix Plus 路由器中的备份路由引擎,或者替换已连接 LCC 中出现故障的路由引擎并将主要角色切换为该 LCC。更换的路由引擎必须与 TX Matrix Plus 路由器中的主路由引擎运行相同的软件版本。

如果路由矩阵中的所有主路由引擎和备份路由引擎均未在相同的 Junos OS 版本上运行,则当在层次结构级别包含[edit chassis redundancy]failover on-loss-of-keepalives语句is not时,将发生以下情况:

  • 如果对 TX Matrix Plus 路由器中的备份路由引擎发起主要角色更改,则所有连接的 LCC 在逻辑上都与 TX Matrix Plus 路由器断开连接。要重新连接连接的 LCC,请将连接 LCC 中所有主路由引擎的主要角色切换到其备份路由引擎。

  • 如果开始将主要角色更改为连接的 LCC 中的备份路由引擎,则连接的 LCC 在逻辑上会断开与 TX Matrix Plus 路由器的连接。要重新连接连接的 LCC,请将连接的 LCC 中新主路由引擎的主要角色切换回原始主路由引擎。

需要停止路由引擎的情况

关闭包含两个路由引擎的路由平台的电源之前,或移除主路由引擎之前,必须先停止备份路由引擎,然后停止主路由引擎。否则,您可能需要重新安装 Junos OS。您可以对主路由引擎使用 request system halt both-routing-engines 命令,该命令首先关闭主路由引擎,然后关闭备份路由引擎。要仅关闭备份路由引擎,请 request system halt 对备份路由引擎发出命令。

如果停止主路由引擎且未关闭或将其移除,则备用路由引擎将一直处于非活动状态,除非您将它配置为主路由引擎在检测到来自主路由引擎的激活信号丢失时成为主路由引擎。

注意:

要重新启动路由器,必须登录到路由引擎的控制台端口(而非以太网管理端口)。登录到主路由引擎的控制台端口时,系统会自动重新启动。登录备份路由引擎的控制台端口后,按 Enter 重新启动。

注意:

如果升级了备份路由引擎,请先重新启动它,然后重新启动主路由引擎。