对一个节点处于保持状态,另一个节点处于丢失状态的 SRX 机箱群集进行故障排除
问题
描述
SRX 机箱群集的节点处于保持和丢失状态。
环境
SRX 机箱群集
症状
连接电缆并以群集模式重新启动设备后,SRX 机箱群集的一个节点处于保持状态,另一个节点处于丢失状态。 show chassis cluster status 在每个节点上运行命令,查看节点的状态。下面是一个示例输出:
{hold:node0} user@node0> show chassis cluster status
Cluster ID: 1, Redundancy-group: 0
Node name Priority Status Preempt Manual failover
node0 100 hold No No
node1 1 lost No No
{hold:node1}
user@node1> show chassis cluster status
Cluster ID: 1, Redundancy-group: 0
Node name Priority Status Preempt Manual failover
node0 100 lost No No
node1 1 hold No No
如果节点的状态为 hold,则该节点尚未准备好在机箱群集中运行。
此问题不会影响高端 SRX 系列防火墙,因为这些设备具有专用的控制和管理端口。
原因
在群集模式下启动分支机构 SRX 系列防火墙时,系统会为机箱群集的带外管理链路 (fxp0) 和控制链路 (fxp1) 指定两个收入接口(具体取决于设备型号)。fxp0 和 fxp1 端口不能用于传输流量。
如果配置 fxp0 和 fxp1 端口,机箱群集将进入保持/丢失状态。下表列出了指定为分支机构 SRX 系列防火墙的 fxp0 和 fxp1 端口:
装置 |
管理 (fxp0) |
HA 控制 (fxp1) |
交换矩阵(fab0 和 fab1)—必须配置 |
|---|---|---|---|
SRX300 |
ge-0/0/0 |
ge-0/0/1 |
任意 GE 接口 |
SRX320 |
ge-0/0/0 |
ge-0/0/1 |
任意 GE 接口 |
SRX340、SRX345 和 SRX380 |
管理 |
ge-0/0/1 |
任意 GE 接口 |
分辨率
删除运行出厂默认配置的设备上的配置
出厂默认配置包括对转换为 fxp0 和 fxp1 接口的接口的配置。必须先删除这些配置,然后才能启用机箱群集模式。在以下情况下,设备可以采用出厂默认配置:
通常,新设备在机箱群集中使用。这些新设备提供出厂默认配置,其中包括接口配置。
如果处于机箱群集模式的设备崩溃,则设备可能会采用出厂默认配置。
要移除接口上的配置,请删除出厂默认配置并重新配置设备。
以下过程将移除当前配置。
登录设备并进入配置模式。
delete执行命令,从设备中删除当前配置。root# delete This will delete the entire configuration Delete everything under this level? [yes,no] (no) yes
配置 root 密码并提交配置:
root# set system root-authentication plain-text-password root# commit
移除作为独立设备运行的设备上的配置
如果设备当前在生产环境中运行,请检查是否配置了指定为 fxp0 和 fxp1 接口的接口。要确定哪些接口将转换为 fxp0 和 fxp1 接口,请参阅 表 1。
运行以下命令,列出 fxp0 和 fxp1 接口的配置:
show | display set | match <physical interface of the control port (fxp1)>show | display set | match <physical interface of the management port (fxp0)>例如:
show configuration | display set | match ge-0/0/0show configuration | display set | match ge-0/0/1从每个配置层级中删除与接口相关的所有配置。
您还可以选择删除整个配置并重新配置设备:
root# delete