替换 SRX 系列高端机箱群集中的路由引擎
您可以使用以下任一方法替换机箱群集中节点上的路由引擎:
更换路由引擎:USB 闪存驱动方法
以下是此过程的先决条件和假设:
提供控制台和 SSH 访问。
USB 闪存驱动器提供固件包,固件版本与设备上当前安装的 Junos OS 版本匹配。
show version
使用命令识别 Junos OS 版本。您可以从 https://support.juniper.net/support/downloads/ 下载固件机箱群集仅配置了两个冗余组(RG0 和 RG1)。
此过程包括在机箱群集设置的节点 0 上更换路由引擎的步骤。您可以按照相同的步骤在节点 1 上更换路由引擎。
要使用 USB 闪存驱动器替换机箱群集的节点 0 上的路由引擎:
- 准备关闭节点 0:
对冗余组 (LAG) 从节点 0 到节点 1 执行手动故障转移。
故障转移 RG1:
root@node0> request chassis cluster failover redundancy-group 1 node 1
故障转移 RG0:
root@node0> request chassis cluster failover redundancy-group 0 node 1
验证故障转移后,节点 1 上的两个 RE 均处于活动状态:
root@node0> show chassis cluster status {secondary:node0} root@node0> show chassis cluster status Monitor Failure codes: CS Cold Sync monitoring FL Fabric Connection monitoring GR GRES monitoring HW Hardware monitoring IF Interface monitoring IP IP monitoring LB Loopback monitoring MB Mbuf monitoring NH Nexthop monitoring NP NPC monitoring SP SPU monitoring SM Schedule monitoring CF Config Sync monitoring RE Relinquish monitoring Cluster ID: 1 Node Priority Status Preempt Manual Monitor-failures Redundancy group: 0 , Failover count: 1 node0 129 secondary no no None node1 255 primary no no None Redundancy group: 1 , Failover count: 1 node0 129 secondary no no None node1 255 primary no no None
检查是否已安装任何许可证:
root@node0> show system licenses {secondary:node0} root@node0> show system licenses License usage: Licenses Licenses Licenses Expiry Feature name used installed needed subscriber-acct 0 1 0 permanent subscriber-auth 0 1 0 permanent subscriber-addr 0 1 0 permanent subscriber-vlan 0 1 0 permanent subscriber-ip 0 1 0 permanent scale-subscriber 0 1000 0 permanent scale-l2tp 0 1000 0 permanent scale-mobile-ip 0 1000 0 permanent Licenses installed: License identifier: xxxxxxxxxx License version: 2 Features: subscriber-acct - Per Subscriber Radius Accounting permanent subscriber-auth - Per Subscriber Radius Authentication permanent subscriber-addr - Address Pool Assignment permanent subscriber-vlan - Dynamic Auto-sensed Vlan permanent subscriber-ip - Dynamic and Static IP permanent
如果已安装许可证,请将命令输出
show system license keys
复制到文件中:root@node0> show system license keys
- 将节点 0 上的路由引擎配置和脚本(如果有)备份到 USB 闪存驱动器:
访问节点 0 上的 UNIX 级别 shell:
root@node0>start shell user root {secondary:node0} root@node0> start shell user root Password: root@node0%
安装 USB 闪存驱动器之前,请列出 dev 文件夹中名称以 da 开始的所有目录:
root@node0% ls /dev/da* root@node0% ls /dev/da* /dev/da0 /dev/da0s1c /dev/da0s2a /dev/da0s3 /dev/da0s3e /dev/da0s1 /dev/da0s1f /dev/da0s2c /dev/da0s3c /dev/da0s1a /dev/da0s2 /dev/da0s2f /dev/da0s3d
将 USB 闪存驱动器插入 USB 端口。
将显示以下输出:
root@node0% umass1: TOSHIBA TransMemory, rev 2.00/1.00, addr 3 da2 at umass-sim1 bus 1 target 0 lun 0 da2: <TOSHIBA TransMemory 5.00> Removable Direct Access SCSI-0 device da2: 40.000MB/s transfers da2: 983MB (2013184 512 byte sectors: 64H 32S/T 983C)
列出 dev 文件夹中名称以 da 开始的所有目录,并标识 USB 驱动器。
root@node0% ls /dev/da* root@node0% ls /dev/da* /dev/da0 /dev/da0s1c /dev/da0s2a /dev/da0s3 /dev/da0s3e /dev/da0s1 /dev/da0s1f /dev/da0s2c /dev/da0s3c /dev/da2 /dev/da0s1a /dev/da0s2 /dev/da0s2f /dev/da0s3d /dev/da2s1
在此示例中,USB 闪存驱动器为 /dev/da2s1。
创建用于安装 USB 闪存驱动器的目录:
root@node0% mkdir /var/tmp/usb
将 USB 闪存驱动器安装到 /var/tmp/usb 目录:
root@node0% mount -t msdosfs /dev/da2s1 /var/tmp/usb
将节点 0 上的配置保存到 tmp 文件夹:
root@node0% cli show configuration | save /var/tmp/config[date]
将配置文件复制到 USB 闪存驱动器:
root@node0% cp /var/tmp/config[date] /var/tmp/usb/config[date]
检查配置中是否引用了任何脚本:
root@node0> show configuration system scripts {secondary:node0} root@node0> show configuration system scripts set system scripts commit file interface-monitoring-check.slax set system scripts op file srx-monitor.xsl
root@node0> show configuration event-options {secondary:node0} root@node0> show configuration event-options set event-options generate-event 60s time-interval 60 set event-options policy NAT-POOL-UTIL events 60s set event-options policy NAT-POOL-UTIL then event-script srx-nat-bucket-overload.slax arguments utilization-threshold 90 set event-options policy NAT-POOL-UTIL then event-script srx-nat-bucket-overload.slax arguments pool GLOBAL set event-options event-script traceoptions file escript.log size 1m files 2 set event-options event-script traceoptions flag output set event-options event-script file srx-monitor-addbook-policy-count.slax
如果配置中引用了任何脚本,请备份以下脚本:
root@node0% cp -r /var/db/scripts/ /var/tmp/usb/scripts/
验证复制到 USB 闪存驱动器的文件:
root@node0% ls /var/tmp/usb
卸载 USB 闪存驱动器:
root@node0% umount /var/tmp/usb
卸下 USB 闪存驱动器。
退出 Shell。
root@node0% exit
- 安装更换的路由引擎:
关闭节点 0:
root@node0> request system power-off
等待控制台上出现消息,确认服务已停止,然后物理关闭电源。
为连接到节点 0 的所有电缆添加标签并断开连接。
更换路由引擎。
要防止出现分脑的情况(其中控制链路在两个节点均处于主要状态时处于连接状态),请仅将控制台电缆和电缆重新连接到 fxp0 接口。断开其余电缆。
确保节点 1 上的控制链路和交换矩阵链路状态处于关闭状态:
root@node1> show chassis cluster interfaces {primary:node1} root@node1> show chassis cluster interfaces Control link status: Down Control interfaces: Index Interface Monitored-Status Internal-SA Security 0 em0 Down Disabled Disabled 1 em1 Down Disabled Disabled Fabric link status: Down Control interfaces: Name Child-Interface Status Security (Physical/Monitored) fab0 xe-11/0/3 Down / Down Disable fab0
开启节点 0 的电源。
- 在新的路由引擎上加载配置文件、固件和脚本文件:
将 USB 闪存驱动器插入节点 0 上的 USB 端口,并访问节点 0 上的 UNIX 级别 shell:
root@node0> start shell user root
从 USB 复制配置文件、固件和脚本文件:
root@node0% cp /var/tmp/usb/config[date] /var/tmp/config[date]
root@node0% cp /var/tmp/usb/junos version /var/tmp/junos version
root@node0% cp -r /var/tmp/usb/scripts/ /var/db/scripts/
卸载 USB 闪存驱动器:
root@node0% umount /var/tmp/usb
卸下 USB 闪存驱动器。
退出 Shell。
root@node0% exit
- 配置路由引擎:
加载固件:
root@node0>request software add /var/tmp/junos-release-domestic.tgz reboot
设备重新启动并附带预期的 Junos OS 版本。
(可选)应用您在步骤 1 中备份的许可证:
root@node0> request system license add terminal
请参阅 添加新许可证(CLI 过程)
加载并提交配置:
root@node0> configure shared
root@node0# load override /var/tmp/filename
root@node0# commit
root@node0# exit
- 检查所有 FPC 和 PIC 的状态,确保所有 FPC 和 PIC 都联机。
root@node0>show chassis fpc pic-status
- 从控制台停止节点 0:
root@node0>request system halt
- 等待控制台上出现消息,确认服务已停止,然后将所有电缆连接到节点 0。
- 按控制台上的任意键启动节点 0。
- 检查节点 1 上的机箱群集状态:
root@node1> show chassis cluster status
节点 0 出现,成为 RG0 和 RG1 上的辅助节点。等待,直到 RG1 上的节点 0 优先级更改到配置的值。
- 验证会话是否显示在节点 0 上,以及节点 0 上的会话数是否几乎等于主节点(节点 1)上的会话数:
root@node1> show security monitoring
- 如果群集运行正常,请重置群集优先级:
root@node1> request chassis cluster failover reset redundancy-group 1
root@node1> request chassis cluster failover reset redundancy-group 0
替换路由引擎:外部 SCP 服务器方法
以下是此过程的假设和先决条件:
提供控制台访问和 SSH 访问。
机箱群集仅配置了两个冗余组(RG0 和 RG1)。
此过程包括在机箱群集设置的节点 0 上更换路由引擎的步骤。您可以按照相同的步骤在节点 1 上更换路由引擎。
要使用外部安全复制协议 (SCP) 服务器替换机箱群集的节点 0 上的路由引擎:
- 准备关闭节点 0:
对冗余组 (LAG) 从节点 0 到节点 1 执行手动故障转移。
故障转移 RG1:
root@node0> request chassis cluster failover redundancy-group 1 node 1
故障转移 RG0:
root@node0> request chassis cluster failover redundancy-group 0 node 1
验证故障转移后节点 1 上的两个 RG 均处于活动状态::
root@node0> show chassis cluster status {secondary:node0} root@node0> show chassis cluster status Monitor Failure codes: CS Cold Sync monitoring FL Fabric Connection monitoring GR GRES monitoring HW Hardware monitoring IF Interface monitoring IP IP monitoring LB Loopback monitoring MB Mbuf monitoring NH Nexthop monitoring NP NPC monitoring SP SPU monitoring SM Schedule monitoring CF Config Sync monitoring RE Relinquish monitoring Cluster ID: 1 Node Priority Status Preempt Manual Monitor-failures Redundancy group: 0 , Failover count: 1 node0 129 secondary no no None node1 255 primary no no None Redundancy group: 1 , Failover count: 1 node0 129 secondary no no None node1 255 primary no no None
检查是否已安装任何许可证:
root@node0> show system licenses {secondary:node0} root@node0> show system licenses License usage: Licenses Licenses Licenses Expiry Feature name used installed needed subscriber-acct 0 1 0 permanent subscriber-auth 0 1 0 permanent subscriber-addr 0 1 0 permanent subscriber-vlan 0 1 0 permanent subscriber-ip 0 1 0 permanent scale-subscriber 0 1000 0 permanent scale-l2tp 0 1000 0 permanent scale-mobile-ip 0 1000 0 permanent Licenses installed: License identifier: xxxxxxxxxx License version: 2 Features: subscriber-acct - Per Subscriber Radius Accounting permanent subscriber-auth - Per Subscriber Radius Authentication permanent subscriber-addr - Address Pool Assignment permanent subscriber-vlan - Dynamic Auto-sensed Vlan permanent subscriber-ip - Dynamic and Static IP permanent
如果已安装许可证,请将命令输出
show system license keys
复制到文件中:root@node0> show system license keys
- 备份路由引擎配置:
将配置保存到 tmp 文件夹:
root@node0> edit
root@node0# save /var/tmp/config[date]
访问节点 0 上的 UNIX 级别 shell:
root@node0> start shell user root
将配置文件复制到启用了 SCP 的外部服务器:
root@node0% scp /var/tmp/node0-config-yyyy-mm-dd root@server-ip:/node0-config-yyyy-mm-dd
检查配置中是否引用了任何脚本:
root@node0> show configuration system scripts {secondary:node0} root@node0> show configuration system scripts set system scripts commit file interface-monitoring-check.slax set system scripts op file srx-monitor.xsl
root@node0> show configuration event-options {secondary:node0} root@node0> show configuration event-options set event-options generate-event 60s time-interval 60 set event-options policy NAT-POOL-UTIL events 60s set event-options policy NAT-POOL-UTIL then event-script srx-nat-bucket-overload.slax arguments utilization-threshold 90 set event-options policy NAT-POOL-UTIL then event-script srx-nat-bucket-overload.slax arguments pool GLOBAL set event-options event-script traceoptions file escript.log size 1m files 2 set event-options event-script traceoptions flag output set event-options event-script file srx-monitor-addbook-policy-count.slax
如果配置中引用了任何脚本,请备份以下脚本:
root@node0% scp /var/db/scripts/commit/commit-script.slax root@server-ip: /commit-script.slax
验证外部 SCP 服务器上保存的配置。
退出 Shell。
root@node0% exit
- 安装更换的路由引擎:
关闭节点 0:
root@node0> request system power-off
等待控制台上出现消息,确认服务已停止,然后物理关闭电源。
为连接到节点 0 的所有电缆添加标签并断开连接。
更换路由引擎。
要防止出现分脑的情况(其中控制链路在两个节点均处于主要状态时处于连接状态),请仅将控制台电缆和电缆重新连接到 fxp0 接口。断开其余电缆。
确保节点 1 上的控制链路和交换矩阵链路状态处于关闭状态:
root@node1> show chassis cluster interfaces {primary:node1} root@node1> show chassis cluster interfaces Control link status: Down Control interfaces: Index Interface Monitored-Status Internal-SA Security 0 em0 Down Disabled Disabled 1 em1 Down Disabled Disabled Fabric link status: Down Control interfaces: Name Child-Interface Status Security (Physical/Monitored) fab0 xe-11/0/3 Down / Down Disable fab0
开启节点 0 的电源。
- 在新的路由引擎上加载配置文件和脚本:
从控制台登录到节点 0 上的路由引擎。
配置 fxp0 接口的 IP 地址,并添加访问外部服务器所需的路由:
root@node0> edit
root@node0# set system services ssh
root@node0# set interfaces fxp0 unit 0 family inet address ip-address mask
root@node0# set system root-authentication plain-text-password
机箱群集信息存储在交换机控制板 (SCB) 中。设备会启用群集,如果没有群集端口配置,则不允许提交。在节点 0 上应用节点 1 端口配置。
您可以从节点 1 查看控制端口配置:
root@node1>show configuration chassis cluster control-ports | display set
提交配置:
root@node0# commit
注意:管理和基本路由配置已经完成。您可以使用命令从节点
ping
验证外部服务器的可访问性。退出配置模式:
root@node0# exit
root@node0>
从外部服务器加载 Junos OS 映像:
root@node0> start shell user root
root@node0% cd /var/tmp
root@node0% scp root@server-ip: junos-release-domestic.tgz /var/tmp/
root@node0% cli
root@node0>request system software add /var/tmp/junos-release-domestic.tgz reboot
设备重新启动并附带预期的 Junos OS 版本。
从外部 SCP 服务器复制配置文件:
root@node0% scp root@server-ip: /node0-config-yyyy-mm-dd /var/tmp/node0-config-yyyy-mm-dd
(可选)如果备份了脚本,请从外部 SCP 服务器还原脚本:
root@node0% scp root@server-ip: /commit-script.slax /var/db/scripts/commit/commit-script.slax
(可选)应用您在步骤 1 中备份的许可证:
root@node0>request system license add terminal
请参阅 添加新许可证(CLI 过程)
加载配置:
root@node0> configure shared
root@node0# load override /var/tmp/node0-config-yyyy-mm-dd
root@node0# commit
root@node0# exit
- 检查所有 FPC 和 PIC 的状态,确保所有 FPC 和 PIC 都联机。
root@node0>show chassis fpc pic-status
- 从控制台停止节点 0:
root@node0> request system halt
- 等待控制台上出现消息,确认服务已停止,然后将所有电缆连接到节点 0。
- 按控制台上的任意键启动节点 0。
- 检查节点 1 上的机箱群集状态:
root@node1> show chassis cluster status
节点 0 出现,成为 RG0 和 RG1 上的辅助节点。等待,直到 RG1 上的节点 0 优先级更改到配置的值。
- 验证会话是否显示在节点 0 上,以及节点 0 上的会话数是否几乎等于主节点(节点 1)上的会话数:
root@node1> show security monitoring
- 如果群集运行正常,请重置群集优先级:
root@node1> request chassis cluster failover reset redundancy-group 1
root@node1> request chassis cluster failover reset redundancy-group 0
替换路由引擎:文件传输方法
要通过从机箱群集中的另一个节点传输文件来替换和配置路由引擎(例如,使用节点 0):
- 确保固件映像在 /var/tmp 文件夹中的节点 1 上可用。您可以从 https://support.juniper.net/support/downloads/ 下载固件。
- 将配置的本地副本保存在节点 1 上的 /var/tmp 文件夹中:
user@node1# show configuration | save /var/tmp/cfg-node1
- 准备关闭节点 0:
对冗余组 (LAG) 从节点 0 到节点 1 执行手动故障转移。
故障转移 RG1:
root@node0> request chassis cluster failover redundancy-group 1 node 1
故障转移 RG0:
root@node0> request chassis cluster failover redundancy-group 0 node 1
验证故障转移后,节点 1 上的两个 RE 均处于活动状态:
root@node0> show chassis cluster status {secondary:node0} root@node0> show chassis cluster status Monitor Failure codes: CS Cold Sync monitoring FL Fabric Connection monitoring GR GRES monitoring HW Hardware monitoring IF Interface monitoring IP IP monitoring LB Loopback monitoring MB Mbuf monitoring NH Nexthop monitoring NP NPC monitoring SP SPU monitoring SM Schedule monitoring CF Config Sync monitoring RE Relinquish monitoring Cluster ID: 1 Node Priority Status Preempt Manual Monitor-failures Redundancy group: 0 , Failover count: 1 node0 129 secondary no no None node1 255 primary no no None Redundancy group: 1 , Failover count: 1 node0 129 secondary no no None node1 255 primary no no None
检查是否已安装任何许可证:
root@node0> show system licenses {secondary:node0} root@node0> show system licenses License usage: Licenses Licenses Licenses Expiry Feature name used installed needed subscriber-acct 0 1 0 permanent subscriber-auth 0 1 0 permanent subscriber-addr 0 1 0 permanent subscriber-vlan 0 1 0 permanent subscriber-ip 0 1 0 permanent scale-subscriber 0 1000 0 permanent scale-l2tp 0 1000 0 permanent scale-mobile-ip 0 1000 0 permanent Licenses installed: License identifier: xxxxxxxxxx License version: 2 Features: subscriber-acct - Per Subscriber Radius Accounting permanent subscriber-auth - Per Subscriber Radius Authentication permanent subscriber-addr - Address Pool Assignment permanent subscriber-vlan - Dynamic Auto-sensed Vlan permanent subscriber-ip - Dynamic and Static IP permanent
如果已安装许可证,请将命令输出
show system license keys
复制到文件中:root@node0> show system license keys
检查配置中是否引用了任何脚本:
root@node0> show configuration system scripts {secondary:node0} root@node0> show configuration system scripts set system scripts commit file interface-monitoring-check.slax set system scripts op file srx-monitor.xsl
root@node0> show configuration event-options {secondary:node0} root@node0> show configuration event-options set event-options generate-event 60s time-interval 60 set event-options policy NAT-POOL-UTIL events 60s set event-options policy NAT-POOL-UTIL then event-script srx-nat-bucket-overload.slax arguments utilization-threshold 90 set event-options policy NAT-POOL-UTIL then event-script srx-nat-bucket-overload.slax arguments pool GLOBAL set event-options event-script traceoptions file escript.log size 1m files 2 set event-options event-script traceoptions flag output set event-options event-script file srx-monitor-addbook-policy-count.slax
如果配置中引用了任何脚本,请备份以下脚本:
root@node0# scp /var/db/scripts/commit/commit-script.slax root@node1-fxp0-ip: /commit-script.slax
- 安装更换的路由引擎:
关闭节点 0:
root@node0> request system power-off
等待控制台上出现消息,确认服务已停止,然后物理关闭电源。
为连接到节点 0 的所有电缆添加标签并断开连接。
更换路由引擎。
要防止出现分脑的情况(其中控制链路在两个节点均处于主要状态时处于连接状态),请仅将控制台电缆和电缆重新连接到 fxp0 接口。断开其余电缆。
确保节点 1 上的控制链路和交换矩阵链路状态处于关闭状态:
root@node1> show chassis cluster interfaces {primary:node1} root@node1> show chassis cluster interfaces Control link status: Down Control interfaces: Index Interface Monitored-Status Internal-SA Security 0 em0 Down Disabled Disabled 1 em1 Down Disabled Disabled Fabric link status: Down Control interfaces: Name Child-Interface Status Security (Physical/Monitored) fab0 xe-11/0/3 Down / Down Disable fab0
开启节点 0 的电源。
- 在新的路由引擎上加载配置文件和脚本:
从控制台登录到节点 0 上的路由引擎。
为 fxp0 接口配置 root 密码和 IP 地址。不提交配置。
注意:您不需要配置网关,因为前提是两个节点上的 fxp0 接口位于同一子网中。
root@node0> edit
root@node0# set system root-authentication plain-text-password
New password: type password here Retype new password: retype password hereroot@node0# set interfaces fxp0 unit 0 family inet address IP-address
机箱群集信息存储在交换机控制板 (SCB) 中。设备会启用群集,如果没有群集端口配置,则不允许提交。在节点 0 上应用节点 1 端口配置。
您可以从节点 1 查看控制端口配置:
root@node1> show configuration chassis cluster control-ports | display set
提交配置:
root@node0# commit
退出配置模式:
root@node0# exit
root@node0>
使用安全复制协议 (SCP) 将映像和配置从节点 1 复制到节点 0。使用在步骤 5 中为节点 0 fxp0 接口配置的 IP 地址。
root@node1>scp /var/tmp/image-file root@node0-fxp0-ip:/var/tmp/
root@node1>scp /var/tmp/cfg-node1 root@node0-fxp0-ip:/var/tmp/
将路由引擎上的 Junos OS 映像更新为所需版本:
root@node1>request system software add /var/tmp/junos-release-domestic.tgz reboot
设备重新启动并附带预期的 Junos OS 版本。
(可选)从节点 1 复制您在步骤 3 中备份的脚本:
root@node1>scp /var/db/scripts/op/op-script.slax root@node0-fxp0-ip: /var/db/scripts/op/
(可选)应用在步骤 3 中备份的许可证:
root@node0> request system license add terminal
加载配置:
root@node0> load override /var/tmp/cfg-node1
root@node0> commit
验证配置提交是否没有任何错误。
- 检查所有 FPC 和 PIC 的状态,确保所有 FPC 和 PIC 均联机:
root@node0>show chassis fpc pic-status
- 从控制台停止节点 0:
root@node0>request system halt
- 等待控制台上出现消息,确认服务已停止,然后连接所有断开连接的电缆。
- 按控制台上的任意键启动节点 0。
- 检查节点 1 上的机箱群集状态:
root@node1>show chassis cluster status
节点 0 出现,成为 RG0 和 RG1 上的辅助节点。等待,直到 RG1 上的节点 0 优先级更改到配置的值。
- 验证会话是否显示在节点 0 上,以及节点 0 上的会话数是否几乎等于主节点(节点 1)上的会话数:
root@node1>show security monitoring
- 如果群集运行正常,请重置群集优先级:
root@node1>request chassis cluster failover reset redundancy-group 1
root@node1>request chassis cluster failover reset redundancy-group 0