Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

监控机箱群集接口

接口监控通过检查接口是处于打开还是关闭状态来监视接口的状态。当一个或多个受监控接口发生故障时,冗余组会故障转移到群集中的另一个节点。有关详细信息,请参阅以下主题:

了解机箱群集冗余组接口监控

要使冗余组自动故障转移到另一个节点,必须监控其接口。配置冗余组时,您可以指定一组接口,冗余组要监控这些接口的状态(或“运行状况”),以确定接口是打开还是关闭。受监控接口可以是其任何冗余以太网接口的子接口。为要监控的冗余组配置接口时,需要为其分配权重。

每个冗余组的阈值容差值最初设置为 255。当冗余组监控的接口不可用时,将从冗余组的阈值中减去其权重。当冗余组的阈值达到 0 时,它会故障转移到另一个节点。例如,如果冗余组 1 在节点 0 上是主组,则在阈值交叉事件中,冗余组 1 将成为节点 1 上的主组。在这种情况下,冗余组 1 的冗余以太网接口的所有子接口都将开始处理流量。

要检查接口权重,请使用以下命令:

  • 显示机箱群集信息

  • 显示机箱群集接口

建议不要在机箱群集中 SRX 系列防火墙的冗余组 0 (RG0) 上配置接口监控和 IP 监控等数据平面模块。

在使用冗余组 0 手动故障转移时要谨慎谨慎。冗余组 0 故障切换意味着路由引擎 (RE) 故障切换,在这种情况下,主节点上运行的所有进程都将被终止,然后在新的主路由引擎 (RE) 上生成。此故障转移可能会导致状态丢失(如路由状态),并通过引入系统改动来降低性能。

发生冗余组故障切换的原因是冗余组的受监控接口的累积权重已将其阈值变为 0。当两个节点上冗余组的受监控接口同时达到其阈值时,冗余组在节点 ID 较低的节点(在本例中为节点 0)上为主冗余组。

  • 如果要抑制由于接口监控故障而发生的故障转移,请使用该 hold-down-interval 语句。

  • 如果冗余组 0 (RG0) 上发生故障转移,则 RG0 辅助设备上的接口监控将禁用 30 秒。这可以防止其他冗余组的故障转移以及 RG0 故障转移。

监控机箱群集冗余组接口的优势

  • 帮助通过特定冗余组确定机箱群集设置中特定接口的状态。

  • 启用接口到另一个节点的自动故障切换(如果接口关闭)。

示例:配置机箱群集冗余组接口监控

此示例说明如何指定由特定冗余组监控接口,以便自动故障转移到另一个节点。为要监控的接口分配权重还显示了如何通过从每个节点配置两个接口并将其映射到冗余组来验证监控接口剩余阈值的过程。

要求

在开始之前,请创建冗余组。请参阅 示例:配置机箱群集冗余组

概述

要在监控接口关闭后检索剩余冗余组阈值,您可以将系统配置为监控属于冗余组的接口的运行状况。为要监控的接口分配权重时,系统会监控接口的可用性。如果物理接口发生故障,则会从相应冗余组的阈值中扣除权重。每个冗余组的阈值为 255。如果阈值达到 0,则会触发故障切换,即使冗余组处于手动故障切换模式且未启用该 preempt 选项也是如此。

在此示例中,您可以通过配置每个节点的两个接口并将其映射到冗余组 1 (RG1) 来检查监控接口剩余阈值的过程,每个接口具有不同的权重。将 130 和 140 用于节点 0 接口,将 150 和 120 用于节点 1 接口。您可以从每个节点配置一个接口,并将这些接口映射到冗余组 2 (RG2),每个冗余组的默认权重为 255。

图 1 说明了此示例中使用的网络拓扑。

拓扑

图 1:SRX 系列机箱群集接口监控拓扑示例 SRX Series Chassis Cluster Interface Monitoring Topology Example

配置

CLI 快速配置

要快速配置此示例,请复制以下命令,将其粘贴到文本文件中,删除所有换行符,更改与您的网络配置匹配所需的任何详细信息,将命令复制并粘贴到层次结构级别的 CLI edit 中,然后从配置模式进入 commit

程序

分步过程

以下示例要求您在配置层次结构中导航各个级别。有关如何执行此操作的说明,请参阅 Junos OS CLI 用户指南中的在配置模式下使用 CLI 编辑器。

要配置机箱群集接口监控:

  1. 指定冗余以太网接口的数量。

  2. 为路由引擎故障切换属性设置冗余组 0,并设置 RG1 和 RG2(此示例中所有接口都在一个冗余组中)以定义冗余以太网接口的故障切换属性。

  3. 设置接口监控以监控接口的运行状况并触发冗余组故障切换。

    我们不建议对 RG0 进行接口监控,因为它会导致控制平面在发生接口抖动时从一个节点切换到另一个节点。

    接口故障切换仅在权重达到零后发生。

  4. 设置冗余以太网 (reth) 接口并将其分配给区域。

结果

在配置模式下,输入 show chassisshow interfaces 命令确认您的配置。如果输出未显示预期的配置,请重复此示例中的配置说明以进行更正。

如果完成设备配置,请从配置模式输入 commit

验证

以下部分将引导您完成验证接口状态和(在某些情况下)故障排除的过程。该过程将向您展示如何检查冗余组中每个接口的状态,在禁用后再次检查它们,并查找有关每个接口的详细信息,直到您圈出冗余组中的所有接口为止。

在此示例中,您可以通过从每个节点配置两个接口并将其映射到 RG1(每个接口具有不同的权重)来验证监控接口剩余阈值的过程。将 130 和 140 用于节点 0 接口,将 150 和 120 用于节点 1 接口。您可以从每个节点配置一个接口,并将这些接口映射到 RG2,每个接口的默认权重为 255。

验证机箱群集状态

目的

验证机箱群集状态、故障切换状态和冗余组信息。

行动

在操作模式下,输入 show chassis cluster status 命令。

意义

使用 show chassis cluster status 命令确认机箱群集中的设备通信正常,一台设备用作主节点,另一台设备用作辅助节点。

验证机箱群集接口

目的

验证有关正在同步的不同对象的统计信息、结构和控制接口问候以及集群中监控接口状态的信息。

行动

在操作模式下,输入 show chassis cluster interfaces 命令。

意义

示例输出确认监控接口已启动,并且受监控的每个接口的权重已按配置正确显示。这些值不会在接口启动或关闭时更改。权重仅针对冗余组更改,并且可以在使用命令时 show chassis cluster information 查看。

验证机箱群集信息

目的

验证有关正在同步的不同对象的统计信息、结构和控制接口问候以及集群中监控接口状态的信息。

行动

在操作模式下,输入 show chassis cluster information 命令。

意义

示例输出确认节点 0 和节点 1 运行正常,设备上的绿色 LED 表示没有故障。此外,还会显示冗余组的默认权重 (255)。每当映射到相应冗余组的接口出现故障时,就会扣除默认权重。

请参阅后续验证部分,了解当监控接口关闭或启动时冗余组值如何变化。

在节点 0 中禁用权重为 130 的节点 RG1 的接口 ge-0/0/1 后,验证接口 ge-0/0/1 状态

目的

验证节点 0 上的接口 ge-0/0/1 是否已禁用。

行动

在配置模式下,输入 set interface ge-0/0/1 disable 命令。

意义

示例输出确认接口 ge-0/0/1 已禁用。

在权重为 130 的节点 0 中禁用 RG1 的接口 ge-0/0/1 后验证机箱群集状态

目的

验证机箱群集状态、故障切换状态和冗余组信息。

行动

在操作模式下,输入 show chassis cluster status 命令。

意义

使用 show chassis cluster status 命令确认机箱群集中的设备通信正常,一台设备用作主节点,另一台设备用作辅助节点。

在权重为 130 的节点 0 中禁用 RG1 的接口 ge-0/0/1 后验证机箱群集接口

目的

验证有关正在同步的不同对象的统计信息、结构和控制接口问候以及集群中监控接口状态的信息。

行动

在操作模式下,输入 show chassis cluster interfaces 命令。

意义

示例输出确认监控接口 ge-0/0/1 已关闭。

在权重为 130 的节点 0 中禁用 RG1 的接口 ge-0/0/1 后验证机箱群集信息

目的

验证有关正在同步的不同对象的统计信息、结构和控制接口问候以及集群中监控接口状态的信息。

行动

在操作模式下,输入 show chassis cluster information 命令。

意义

示例输出确认,在节点 0 中,RG1 权重减少到 125(即 255 减去 130),因为监控接口 ge-0/0/1(权重为 130)下降。监控状态为不正常,设备 LED 呈琥珀色,ge-0/0/1 的接口状态为关闭。

如果恢复接口 ge-0/0/1,则节点 0 中 RG1 的权重将变为 255。相反,如果接口 ge-0/0/2 也被禁用,则节点 0 中 RG1 的权重将变为 0 或更小(在本例中为 125 减去 140 = -15)并触发故障转移,如下一部分验证部分所示。

验证接口 ge-0/0/2 是否已禁用

目的

验证节点 0 上的接口 ge-0/0/2 是否已禁用。

行动

在配置模式下,输入 set interface ge-0/0/2 disable 命令。

意义

示例输出确认接口 ge-0/0/2 已禁用。

禁用接口 ge-0/0/2 后验证机箱群集状态

目的

验证机箱群集状态、故障切换状态和冗余组信息。

行动

在操作模式下,输入 show chassis cluster status 命令。

意义

使用 show chassis cluster status 命令确认机箱群集中的设备通信正常,一台设备用作主节点,另一台设备用作辅助节点。在 RG1 上,您会看到接口故障,因为在接口监控期间,映射到节点 0 上 RG1 的两个接口都失败了。

禁用接口 ge-0/0/2 后验证机箱群集接口

目的

验证有关机箱群集接口的信息。

行动

在操作模式下,输入 show chassis cluster interfaces 命令。

意义

示例输出确认监控接口 ge-0/0/1 和 ge-0/0/2 已关闭。

禁用接口 ge-0/0/2 后验证机箱群集信息

目的

验证有关正在同步的不同对象的统计信息、结构和控制接口问候以及集群中监控接口状态的信息。

行动

在操作模式下,输入 show chassis cluster information 命令。

意义

示例输出确认在节点 0 中,监控接口 ge-0/0/1 和 ge-0/0/2 已关闭。节点 0 上 RG1 的权重达到零值,在使用命令期间 show chassis cluster status 触发 RG1 故障转移。

对于 RG2,冗余以太网接口 2 (reth2) 的默认权重设置为 255。当需要接口监控时,我们建议您在没有像 RG1 那样的备份链路时使用默认权重。也就是说,如果接口 ge-0/0/3 被禁用,它会立即触发故障转移,因为权重变为 0(255 减去 225),如下一个验证部分所示。

禁用 ge-0/0/3 后验证接口状态

目的

验证节点 0 上的接口 ge-0/0/3 是否已禁用。

行动

在配置模式下,输入 set interface ge-0/0/3 disable 命令。

意义

示例输出确认接口 ge-0/0/3 已禁用。

禁用接口 ge-0/0/3 后验证机箱群集状态

目的

验证机箱群集状态、故障切换状态和冗余组信息。

行动

在操作模式下,输入 show chassis cluster status 命令。

意义

使用 show chassis cluster status 命令确认机箱群集中的设备通信正常,一台设备用作主节点,另一台设备用作辅助节点。

禁用接口 ge-0/0/3 后验证机箱群集接口

目的

验证有关机箱群集接口的信息。

行动

在操作模式下,输入 show chassis cluster interfaces 命令。

意义

示例输出确认监控接口 ge-0/0/1、ge-0/0/2 和 ge-0/0/3 已关闭。

禁用接口 ge-0/0/3 后验证机箱群集信息

目的

验证有关正在同步的不同对象的统计信息、结构和控制接口问候以及集群中监控接口状态的信息。

行动

在操作模式下,输入 show chassis cluster information 命令。

意义

示例输出确认在节点 0 中,监控接口 ge-0/0/1、ge-0/0/2 和 ge-0/0/3 已关闭。

对于 RG1,仅当启用该 preempt 选项时,允许节点 0 中的任何接口启动才会触发故障转移。在示例中, preempt 未启用。因此,节点应恢复正常,RG1 没有显示监视器故障。

验证接口 ge-0/0/2 已启用

目的

验证节点 0 上是否启用了接口 ge-0/0/2。

行动

在配置模式下,输入 delete interfaces ge-0/0/2 disable 命令。

意义

示例输出确认已删除接口 ge-0/0/2 禁用。

启用接口 ge-0/0/2 后验证机箱群集状态

目的

验证机箱群集状态、故障切换状态和冗余组信息。

行动

在操作模式下,输入 show chassis cluster status 命令。

意义

使用 show chassis cluster status 命令确认机箱群集中的设备通信正常,其中一台设备充当主节点,另一台设备充当辅助节点。

启用接口 ge-0/0/2 后验证机箱群集接口

目的

验证有关机箱群集接口的信息。

行动

在操作模式下,输入 show chassis cluster interfaces 命令。

意义

示例输出确认监控接口 ge-0/0/1 和 ge-0/0/3 已关闭。删除禁用后,监控接口 ge-0/0/2 将启动。

启用接口 ge-0/0/2 后验证机箱群集信息

目的

验证有关正在同步的不同对象的统计信息、结构和控制接口问候以及集群中监控接口状态的信息。

行动

在操作模式下,输入 show chassis cluster information 命令。

意义

示例输出确认在节点 0 中,监控接口 ge-0/0/1 和 ge-0/0/3 已关闭。删除禁用后,监控接口 ge-0/0/2 处于活动状态。

验证机箱群集 RG2 抢占

目的

验证机箱群集 RG2 是否在节点 0 上被抢占。

行动

在配置模式下,输入 set chassis cluster redundancy-group 2 preempt 命令。

意义

示例输出确认机箱群集 RG2 在节点 0 上被抢占。

在下一节中,您将检查当禁用的节点 0 接口联机时启用抢占时,RG2 是否故障转移回节点 0。

抢占 RG2 后验证机箱群集状态

目的

验证机箱群集状态、故障切换状态和冗余组信息。

行动

在操作模式下,输入 show chassis cluster status 命令。

意义

使用 show chassis cluster status 命令确认机箱群集中的设备通信正常,一台设备用作主节点,另一台设备用作辅助节点。

验证接口 ge-0/0/3 已启用

目的

验证节点 0 上是否启用了接口 ge-0/0/3。

行动

在配置模式下,输入 delete interfaces ge-0/0/3 disable 命令。

意义

示例输出确认接口 ge-0/0/3 禁用已删除。

启用接口 ge-0/0/3 后验证机箱群集状态

目的

验证机箱群集状态、故障切换状态和冗余组信息。

行动

在操作模式下,输入 show chassis cluster status 命令。

意义

使用 show chassis cluster status 命令确认机箱群集中的设备通信正常,一台设备用作主节点,另一台设备用作辅助节点。

启用接口 ge-0/0/3 后验证机箱群集接口

目的

验证有关机箱群集接口的信息。

行动

在操作模式下,输入 show chassis cluster interfaces 命令。

意义

示例输出确认监控接口 ge-0/0/1 已关闭。删除禁用后,监控接口 ge-0/0/2 和 ge-0/0/3 将启动。

启用接口 ge-0/0/3 后验证机箱群集信息

目的

验证有关正在同步的不同对象的统计信息、结构和控制接口问候以及集群中监控接口状态的信息。

行动

在操作模式下,输入 show chassis cluster information 命令。

意义

示例输出确认在节点 0 中,监控接口 ge-0/0/1 已关闭。当接口 ge-0/0/3 备份时,节点 0 状态上的 RG2 将返回到主状态(因为抢占启用),运行状况良好的权重为 255。