对一个节点处于主状态,另一个节点处于禁用状态的 SRX 机箱群集进行故障排除
问题
描述
SRX 机箱群集的节点处于主状态和禁用状态。
环境
SRX 机箱群集
症状
群集的一个节点处于主状态,另一个节点处于禁用状态。 show chassis cluster status
在每个节点上运行命令以查看节点的状态。下面是一个示例输出:
{primary:node0} root@primary-srx> show chassis cluster status Monitor Failure codes: CS Cold Sync monitoring FL Fabric Connection monitoring GR GRES monitoring HW Hardware monitoring IF Interface monitoring IP IP monitoring LB Loopback monitoring MB Mbuf monitoring NH Nexthop monitoring NP NPC monitoring SP SPU monitoring SM Schedule monitoring CF Config Sync monitoring RE Relinquish monitoring Cluster ID: 1 Node Priority Status Preempt Manual Monitor-failures Redundancy group: 0 , Failover count: 1 node0 255 primary no no None node1 129 disabled no no None Redundancy group: 1 , Failover count: 1 node0 255 primary no no None node1 129 disabled no no None
诊断
-
运行命令
show chassis cluster interfaces
以验证控件和结构链路的状态。是否有任何链接关闭?以下是分支 SRX 系列防火墙和高端 SRX 系列防火墙的示例输出。
root@Branch-SRX> show chassis cluster interfaces Control link 0 name: fxp1 Control link status: Up Fabric interfaces: Name Child-interface Status fab0 ge-0/0/2 up fab0 ge-2/0/6 up fab1 ge-9/0/2 up fab1 ge-11/0/6 up Fabric link status: Up
{primary:node0} root@High-end-SRX> show chassis cluster interfaces Control link 0 name: em0 Control link 1 name: em1 Control link status: Up Fabric interfaces: Name Child-interface Status fab0 ge-2/0/0 down fab0 fab1 fab1 Fabric link status: Up
-
是:请参阅 SRX 机箱群集中的交换矩阵链路故障故障排除或 SRX 机箱群集中的控制链路故障故障排除。
-
否:继续执行步骤 2。
-
-
重新启动已禁用的节点。节点在重新启动后是否处于这种
disabled
状态?-
是:可能存在硬件问题。继续执行步骤 3。
-
否:问题已解决。
-
-
检查节点是否存在任何硬件问题。在两个节点上运行命令
show chassis fpc pic-status
,并确保 FPC 处于联机状态。是否看到列出的任何 FPCPresent
的状态为 、OK
或Offline
?下面是一个示例输出。
{primary:node1} root@J-SRX> show chassis fpc pic-status node0: -------------------------------------------------------------------------- Slot 0 Online FPC PIC 0 Online 4x GE Base PIC Slot 2 Online FPC PIC 0 Online 24x GE gPIM Slot 6 Online FPC PIC 0 Online 2x 10G gPIM node1: -------------------------------------------------------------------------- Slot 0 Online FPC PIC 0 Online 4x GE Base PIC Slot 2 Online FPC PIC 0 Online 24x GE gPIM Slot 6 Online FPC PIC 0 Online 2x 10G gPIM
-
是:重新拔插卡并重新启动节点。如果这不能解决问题,请向您的技术支持代表提交案例以进行进一步的故障排除。请参阅 客户支持的数据收集。
-
否:继续执行步骤 4。
-
-
在两个节点上运行 ,
show chassis cluster statistics
并分析输出。{primary:node0} root@J-SRX> show chassis cluster statistics Control link statistics: Control link 0: Heartbeat packets sent: 418410 Heartbeat packets received: 418406 Heartbeat packet errors: 0 Fabric link statistics: Probes sent: 418407 Probes received: 414896 Probe errors: 0
Heartbeat packets received
字段显示非递增值或零 (0),还是Heartbeat packet errors
字段显示非零值?-
是:向您的技术支持代表提交案例,以便进行进一步的故障排除。请参阅 客户支持的数据收集。
-
否:继续执行步骤 5。
-
-
配置(隐藏选项)并提交配置
set chassis cluster no-fabric-monitoring
以在故障排除过程中暂时禁用结构监控。重新启动已禁用的节点。节点重新启动后,运行show chassis cluster statistics
命令。探头还在丢失吗?