Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

全局负载平衡 (GLB)

概述

注意:

对于早期采用者来说,这是一项不断发展的功能。计划在未来的版本中提供更多增强功能。

与其他网络相比,AI-ML 数据中心的熵更少,数据流更大。由于基于哈希的负载平衡并不总是能有效地对此类流量进行负载平衡,因此通常使用动态负载平衡 (DLB) 来代替。但是,DLB 仅考虑本地链路带宽利用率。因此,DLB 只能在紧接下一跃点上有效缓解流量拥塞。全局负载平衡 (GLB) 是 DLB 的一项增强功能,可在下一跳 (NNH) 级别查看拥塞情况。GLB 通过考虑远程链路上的流量拥塞,更有效地对大型数据流进行负载均衡。

传统的负载平衡机制使用散列算法来决定要通过哪个出口接口发送流量。这些算法在接收数据包的五个元组上运算哈希函数。但是,这些算法不考虑它们发送数据包的链路的实时利用率。即使在 DLB 中,决策也完全是本地的,算法无法全局检测链路利用率。如果较远的节点拥塞,则该节点可能会丢弃数据包。

GLB 在决定出口接口之前会考虑远程链路的链路利用率。与 DLB 类似,当一个多路径段遇到拥塞时,GLB 可以将流量分载到其他分支以缓解拥塞。与 DLB 不同,GLB 可以在叶设备上重新路由流量,以避免主干层的流量拥塞。

好处

  • 减少由于拥塞和远程链路故障而导致的数据包丢失

  • 有效地对 Clos 拓扑中的大型数据流进行端到端负载平衡,以避免拥塞

  • 在大型数据流会增加流量拥塞可能性的 AI-ML 部署中特别有用

配置

考虑

配置 GLB 时,请记住以下几点:

  • GLB 仅在 3-Clos(叶-脊-叶)拓扑中受支持。

  • 3-Clos 拓扑中的所有设备都必须支持 GLB,然后才能配置 GLB。

  • 当 3-Clos 拓扑支持 GLB 时,最多可以有 64 个叶设备。

  • GLB 仅支持同一对设备(例如,主干设备和叶设备)之间的一个链路。

GLB 不支持以下功能:

  • 架顶式 (ToR) 与主干设备之间的集成路由和桥接 (IRB) 接口

  • 多宿主服务器

  • 用于叠加路由(IPv4 或 IPv6)的 GLB

  • 在路由实例中获知的 BGP 路由的 GLB

配置 GLB

  1. 配置 DLB。
    交换矩阵中每台设备上的 DLB 配置必须相同。请参阅 动态负载平衡 ,了解如何配置 DLB。
  2. 为每个节点配置节点 ID。

    每个节点都必须有一个节点 ID。配置节点 ID 时,请记住以下几点:

    • 在以下层次结构级别之一配置节点 ID:
    • 如果配置 bgp-identifier 语句,则必须全局配置,而非 groupneighbor 层次结构级别。

    • 每个节点的 BGP 标识符在交换矩阵中必须是唯一的。

  3. 在主干设备上,在模式下helper-only配置 GLB。

    在模式下 helper-only ,BGP 为其播发的路由发送 NNH 节点 (NNHN) 功能。BGP 指示 GLB 应用程序监控具有 EBGP 会话的所有本地链路的链路质量,并将该信息泛洪到所有直接邻接方。在采用 3-Clos 架构的主干设备上配置此选项。

  4. 在叶设备上,在模式下load-balancer-only配置 GLB。

    在模式下 load-balancer-only ,BGP 不会为其播发的路由发送 NNHN 功能。交换机接收来自相邻节点的链路质量。它使用下一跃点和 NNHH 的组合链路质量来做出负载平衡决策。在任何 Clos 架构的叶设备上配置此选项。

  5. 选择性禁用 GLB。
    使用语 global-load-balancing 句全局配置 GLB 后,可以在特定 BGP 组或对等方上选择性地禁用它。要选择性地禁用 GLB,请在以下任一层级使用语 no-global-load-balancing 句:

    例如:

  6. 使用以下命令验证配置是否成功:
    • show bgp global-load-balancing

    • show bgp global-load-balancing path

    • show bgp global-load-balancing path-monitor

    • show bgp global-load-balancing profile

平台支持

请参阅 功能浏览器 ,了解平台和版本支持。