对一个节点处于保留状态,另一个节点处于丢失状态的 SRX 机箱群集进行故障排除
问题
描述
SRX 机箱群集的节点处于保留和丢失状态。
环境
SRX 机箱群集
症状
在群集模式下连接电缆并重新启动设备后,SRX 机箱群集的一个节点处于保留状态,另一个节点处于丢失状态。 show chassis cluster status
在每个节点上运行命令以查看节点的状态。下面是一个示例输出:
{hold:node0} user@node0> show chassis cluster status Cluster ID: 1, Redundancy-group: 0 Node name Priority Status Preempt Manual failover node0 100 hold No No node1 1 lost No No {hold:node1} user@node1> show chassis cluster status Cluster ID: 1, Redundancy-group: 0 Node name Priority Status Preempt Manual failover node0 100 lost No No node1 1 hold No No
如果节点的状态为 hold
,则该节点尚未准备好在机箱群集中运行。
此问题不会影响高端 SRX 系列防火墙,因为这些设备具有专用的控制和管理端口。
原因
在群集模式下启动分支 SRX 系列防火墙时,将为机箱群集的带外管理链路 (fxp0) 和控制链路 (fxp1) 指定两个收入接口(取决于设备型号)。fxp0 和 fxp1 端口不能用于传输流量。
如果配置 fxp0 和 fxp1 端口,机箱群集将进入保留/丢失状态。下表列出了为分支 SRX 系列防火墙指定为 fxp0 和 fxp1 端口的端口:
装置 |
管理 (fxp0) |
高可用性控制 (fxp1) |
结构(fab0 和 fab1)— 必须配置 |
---|---|---|---|
SRX300 |
ge-0/0/0 |
ge-0/0/1 |
任何 ge 接口 |
SRX320 |
ge-0/0/0 |
ge-0/0/1 |
任何 ge 接口 |
SRX340、SRX345 和 SRX380 |
管理管理 |
ge-0/0/1 |
任何 ge 接口 |
分辨率
删除运行出厂默认配置的设备上的配置
出厂默认配置包括转换为 fxp0 和 fxp1 接口的接口配置。在启用机箱群集模式之前,您必须删除这些配置。在以下情况下,设备可以具有出厂默认配置:
通常,机箱群集中使用新设备。这些新设备附带出厂默认配置,其中包括接口配置。
如果处于机箱群集模式的设备崩溃,该设备可能采用出厂默认配置。
要移除接口上的配置,请删除出厂默认配置并重新配置设备。
以下过程将删除当前配置。
登录设备,进入配置模式。
运行命令以
delete
从设备中删除当前配置。root# delete This will delete the entire configuration Delete everything under this level? [yes,no] (no) yes
配置 root 密码并提交配置:
root# set system root-authentication plain-text-password root# commit
删除作为独立设备运行的设备上的配置
如果设备当前在生产环境中运行,请检查是否配置了指定为 fxp0 和 fxp1 接口的接口。要确定哪些接口转换为 fxp0 和 fxp1 接口,请参阅 表 1。
运行以下命令以列出 fxp0 和 fxp1 接口的配置:
show | display set | match <physical interface of the control port (fxp1)>
show | display set | match <physical interface of the management port (fxp0)>
例如:
show configuration | display set | match ge-0/0/0
show configuration | display set | match ge-0/0/1
从每个配置层次结构中删除与接口相关的所有配置。
您还可以选择删除整个配置并重新配置设备:
root# delete