Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

升级双成员 QFX 系列虚拟机箱

关于此网络配置示例

此网络配置示例 (NCE) 说明当不间断软件升级 (NSSU) 进程不可用或不受欢迎时,如何升级双成员 QFX 系列虚拟机箱。此过程可将服务中断降至最低,对数据中心工作负载的影响也微乎其微。QFX 系列的 NSSU 功能在特定版本之间受支持,参见 Junos 发行说明的 QFX 系列部分。

用例概述

虚拟机箱功能是 QFX 系列产品组合的重要方面。数据中心的一个常见虚拟机箱用例是将多个架顶式交换机聚合到一个逻辑实体中,以简化高可用性对的管理和操作。在此用例中,服务器机架多宿主到两个架顶式 QFX 系列交换机。这些交换机被配置为一个虚拟机箱对中,如果其中一个 QFX 系列设备发生故障,则为网络路径提供弹性。

当这些设备需要软件更新时,您通常会使用虚拟机箱的 NSSU 功能升级设备。NSSU 升级有选择地以智能方式升级虚拟机箱成员设备,以最大程度地减少所连接服务器的服务中断。

但是,在某些情况下,“从”版本和“to”版本不支持 NSSU 升级过程。在这些情况下升级时,我们可以通过一系列手动操作来实现类似的结果。此用例介绍了两个版本之间的非 NSSU 升级路径。

技术概述

手动升级双成员虚拟机箱的过程与自动化 NSSU 进程所执行的步骤十分相仿。该序列利用高可用性设计系统地将一台设备从服务中移除,以执行升级和重新启动。当服务器节点双宿主到每个设备时,网络可以在升级窗口期间承受其中一个虚拟机箱成员的移除。在此过程中,整体网络带宽减少了,但网络仍然可用。

虚拟机箱功能使用主机箱/备份概念,使虚拟机箱成员之间的设备状态保持同步。当一台设备处理流量时,我们会使另一台设备脱机并升级。要升级这两台设备,我们执行以下步骤:

  1. 首先,我们将所有流量转移到主设备

  2. 一旦备份设备不再处理服务器流量,我们会拆分虚拟机箱。

  3. 在备份设备完全隔离后,我们升级备份设备上的软件并重新启动。备份设备将保留原始网络配置的副本。

  4. 升级后的备份联机后,我们会将服务器流量从主设备转移到备份设备。备份处理网络负载后,我们升级并重新启动主设备。

  5. 主设备联机后,我们会将流量转移回主设备。

  6. 最后,我们重新启用两台设备之间的虚拟机箱链路,以重新创建运行新软件版本的虚拟机箱对。

配置示例

此配置示例说明如何将双成员虚拟机箱从 Junos OS 14.1X53-D49.1 版升级到 Junos OS 18.1R2.6 版。在这种情况下,NSSU 功能不支持组合,因此我们将使用以下手动流程。

此示例使用基本的虚拟机箱配置,但此处的过程适用于多种不同的用例。

要求

使用此过程可将包含QFX5100、QFX5110、QFX5220或QFX5200交换机的两个成员虚拟机箱的两个成员升级到同一 Junos OS 版本。我们强烈建议虚拟机箱的两个成员使用同一平台,如此示例所示。

开始之前:

  • 如果未预先配置虚拟机箱,请将一个成员配置为主路由引擎,将另一个成员配置为备份路由引擎

  • 确保虚拟机箱由两个成员组成

  • 在虚拟机箱模式(即非虚拟机箱交换矩阵模式)中配置虚拟机箱

  • 确保虚拟机箱仅执行第 2 层功能(即无 IRB 或路由协议)

此示例使用以下硬件和软件组件:

  • 两个运行 Junos OS 14.1X53-D49.1 版的 QFX5100-48S-6Q 设备

  • Junos OS 版本 18.1R2.6

  • 测试运行 Ubuntu Linux 16.04 的服务器

概述

版本之间的升级需要在网络元素之间协调一系列特定的步骤,以确保将过渡期间的停机时间降至最低。如图所示,常规过程将在过渡期间利用与虚拟机箱建立冗余连接的现代服务器的高可用性特性。

在升级开始时,我们先从一个功能两成员虚拟机箱开始。我们的目标是将流量中断降至最低,升级到新的 Junos OS 版本。为此,我们将分离虚拟机箱并将成员设备升级为独立设备。升级设备后,我们将重新连接它们并重新建立虚拟机箱。

拓扑

配置

程序

逐步过程

要升级设备:

  1. 验证虚拟机箱状态。检查虚拟机箱参数并验证您正使用可操作的双成员虚拟机箱。

  2. 将新软件上传到虚拟机箱成员。将新软件复制到虚拟机箱主设备和备份设备上的 /var/tmp 。这一步将两台交换机上的软件分阶段进行升级过程。在传输 Junos OS 映像时,复制操作需要一些时间。

  3. 每当组成只有两个成员的虚拟机箱时,我们建议禁用拆分检测。如果未禁用拆分检测,则主设备可能会在此示例稍后部分禁用备份路由引擎时担任线卡角色并停止控制和数据平面。

    由于使用完全配置的虚拟机箱启动此 NCE,因此应该已配置此选项。如果出于任何原因,请立即配置。

  4. 在备份路由引擎上禁用面向服务器的端口,以最大程度地减少切换期间的中断。

  5. 禁用面向备份路由引擎的 VCP 端口。这会分解虚拟机箱。

  6. 升级备份路由引擎。升级到 18.2 或更高版本 Junos 时,您应该包括以下 force-host 选项。主机操作系统和 Junos 二进制文件都更新并保持匹配。

  7. 通过禁用主设备上的面向服务器的端口并同时重新启用备份上面向服务器的端口来交换面向服务器的端口。在备份设备和主设备上实施相同的配置,以修改这两个设备属于虚拟机箱时留下的任何配置。

    在备份 QFX 上,首先禁用主设备上的面向服务器的端口。不要提交配置:

    然后,通过删除之前的配置,在备份上重新启用面向服务器的端口。提交配置:

    重复主 QFX 上的配置:

  8. 升级主路由引擎。升级到 18.2 或更高版本 Junos 时,您应该包括以下 force-host 选项。主机操作系统和 Junos 二进制文件都更新并保持匹配。

  9. 注意:

    仅当虚拟机箱未进行预配置时,才执行这一步。如果虚拟机箱是预配置的成员资格选择基于系统正常运行时间(如果主路由引擎未预配置)。

  10. 将面向端口的服务器交换回主设备。当虚拟机箱恢复时,重新启用主设备上的面向服务器的端口,以加速 LACP 融合。在备份设备和主设备上实施相同的配置,以修改这两个设备属于虚拟机箱时留下的任何配置。

    在备份 QFX 上,首先通过删除之前的配置,在主设备上重新启用面向服务器的端口。不要提交配置:

    然后,禁用备份上面向服务器的端口并提交配置:

    重复主 QFX 上的配置:

  11. 重新启用两个盒子上的 VCP 端口以重新建立虚拟机箱。

  12. 验证是否已重新建立虚拟机箱。

  13. 在两个成员上启用接入端口。现在虚拟机箱已经重新建立,我们需要重新建立接入端口,以便可以使用主路由引擎 em0 地址与新升级的虚拟机箱进行通信。

    在主 QFX 上:

    注意:

    如果打算向双成员虚拟机箱添加更多设备,请重新启用拆分检测。

    您升级了双成员虚拟机箱。

结论

虚拟机箱是实现数据中心高可用性的重要架构设计。现在,您知道如何手动升级双成员 QFX 系列虚拟机箱,并将对数据中心工作负载的影响降至最低。当 NSSU 不可用或不可取时,使用本文档中概述的过程升级具有类似拓扑结构的任何虚拟机箱。