Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

反应式路径再平衡

概述

动态负载平衡 (DLB) 是处理 AI-ML 数据中心交换矩阵中固有的大型数据流(也称为大象流)的重要工具。 反应式路径再平衡 是对现有 DLB 功能的增强。

在 DLB 的 Flowlet 模式下,您(网络管理员)配置非活动间隔。流量使用分配的传出(出口)接口,直到流暂停的时间超过非活动计时器的时间。如果传出链路质量逐渐下降,则流中的暂停可能不会超过配置的非活动计时器。在这种情况下,经典 Flowlet 模式不会将流量重新分配给其他链路,因此流量无法使用质量更好的链路。反应式路径重新平衡解决了此限制,即使启用了 Flowlet 模式,用户也能将流量移动到质量更好的链路。

设备根据流经链路的流量,为每个等价多路径 (ECMP) 出口成员链路分配一个质量频段。质量带取决于端口负载和队列缓冲区。端口负载是传输的出口字节数。队列缓冲区是等待从出口端口传输的字节数。您可以根据流经 ECMP 的流量模式自定义这些属性。

好处

  • 针对链路降级的可扩展解决方案

  • 优化大型数据流的带宽使用

  • 避免由于长期流而导致的负载平衡效率低下

平台支持

有关平台和版本支持,请参阅 功能资源管理器 。从 Junos OS 演化版 23.4R2 开始,以下平台支持此功能:

  • QFX5240-64OD

  • QFX5240-64QD

拓扑学

在此拓扑中,设备具有三个入口端口和两个出口端口。其中两个入口流是第 2 层 (L2) 流量,一个是第 3 层 (L3) 流量。该图显示了将流量转发到每个出口端口的表条目。所有入口和出口端口的速度相同。

图 1:反应式路径重新平衡 Reactive Path Rebalancing

在此拓扑中,反应式路径重新平衡的工作方式如下:

  1. 配置了增量 2 的质量。

  2. L2 流 1 (mac 0x123) 以 10% 的速率进入入口端口 et-0/0/0。它通过 et-0/0/10 退出。et-0/0/10 的出口链路利用率为 10%,质量频段值为 6。

  3. L3 流以 50% 的速率进入端口 et-0/0/1。它通过 et-0/0/11 退出,并从 ECMP 成员列表中选择最佳链路。et-0/0/11 的出口链路利用率为 50%,质量带值为 5。

  4. L2 流 2 (mac 0x223) 以 40% 的速率进入端口 et-0/0/2。它也通过 et-0/0/11 退出。这会进一步将 et-0/0/11 链路质量频段值降低至 4。现在,两个 ECMP 成员链路的质量带值相差为 2。

  5. 反应路径平衡算法现在可以运行,因为端口 et-0/0/10 和 et-0/0/11 的质量频段值差异等于或高于配置的增量 2。该算法将 L3 流从 et-0/0/11 移动到质量更好的成员链路,在本例中为 et-0/0/10。

  6. 在 L3 蒸汽移动到 et-0/0/10 后,et-0/0/10 链路利用率增加到 60%,质量带值降低到 5。L2 流 2 继续通过 et-0/0/11 退出。et-0/0/11 链路利用率保持在 40%,质量频段值增加到 5。

配置

实施说明

在小流模式下配置 DLB,然后再启用反应路径再平衡。

质量波段的编号为 0 到 7,其中 0 表示最低质量,7 表示最高质量。根据成员端口负载和队列大小,DLB 为成员端口分配一个质量频段值。端口到质量频段映射会根据瞬时端口负载和队列大小而变化。

当同时满足以下两个条件时,反应式路径重新平衡会将流重新分配给更高质量的成员链路:

  • 质量更好的成员链接可用,其质量等于或大于当前成员的质量加上配置的重新分配质量增量值。

    配置该 quality-delta 选项以设置当前流成员与可用于重新分配的成员之间的质量差异。范围为 0 到 8。将其设置为 0 可禁用流的重新分配。

  • 系统生成的数据包随机值低于重新分配概率阈值。

    配置该 prob-threshold 选项以设置反应路径重新平衡用于将现有流重新分配给更好的可用成员的概率阈值。

    • 范围为 0 到 255。将其设置为 0 可禁用流的重新分配。

    • 配置选项 quality-delta 后,概率阈值默认为 100。

    • 配置较低的概率阈值时,流将以较慢的速度移动到质量较高的成员链路。例如,概率阈值为 200 的流比概率阈值为 50 的流更快地移动到更高质量的链接。

使用此功能时,请注意以下事项:

  • 反应路径再平衡是一种全局配置,适用于系统中的所有 ECMP DLB 配置。

  • 质量增量的最佳选择非常重要。不正确的增量可能会导致流量从一个链接持续重新分配到另一个链接。

  • 除了反应路径重新平衡之外,您还可以配置出口量化,以控制流重新分配。

  • 当流量从一个端口移动到另一个端口时,可能会发生数据包重新排序。配置反应式路径重新平衡可能会导致在将流重新分配给新链路时出现暂时的无序问题。

验证和故障排除