Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

计算轨道优化架构中的叶节点和主干节点、服务器和 GPU 的数量

在轨道优化架构中,单个条带中的 叶节点数 由每台服务器的 GPU 数(轨道数)定义。每台 NVIDIA DGX H100 GPU 服务器包括 8 个 NVIDIA H100 Tensor 核心 GPU。因此,单个条带包括 8 个叶节点(8 条轨道)。

叶节点数 = 每台服务器的 GPU 数 = 8

单个条带 (N1) 中支持的最大 服务器数 由叶节点上的 可用端口数 定义,具体取决于交换机型号。

GPU 服务器和叶节点之间的总带宽必须与叶节点和主干节点之间的总带宽相匹配,以保持 1:1 的订阅比。

假设叶节点上的所有接口都以相同的速度运行,则一半接口将用于连接到 GPU 服务器,另一半将用于连接到主干。因此,条带中的 最大服务器数 计算为每个叶节点上 可用端口数的 一半。表 14 包括一些示例。

图 14.1:1 订阅系数的上行链路和下行链路数量

I 图 X 表示下行链路(叶节点和 GPU 服务器之间的链路)的数量,而 Y 表示上行链路(叶节点和主干节点之间的链路)的数量。要允许 1:1 订阅系数,X 必须等于 Y。

每个叶节点上的 可用端口数 等于 X + Y 或 2 * X。

由于条带中的所有服务器都有一个端口连接到条带中的每个叶,因此条带中的最大服务器数 (N1) 等于 X。

N1(每个条带的最大服务器数)= 可用端口数 ÷ 2

条带中的 最大 GPU 数 是通过简单地乘以每台服务器的 GPU 数来计算的。

N2(最大 GPU 数)= N1(每个条带的最大服务器数)* 8

可用端口的总数取决于用于叶节点的交换机型号。表 9 显示了一些示例。

表 9:每个条带支持的最大 GPU 数

叶节点

QFX 交换机型号

每台交换机可用的 400 GE 端口总数

1:1 订阅中每个条带支持的最大服务器数

(N1

每台服务器的 GPU 数

每个条带支持的最大 GPU 数

(第2 页)

QFX5220-32CD 32 32 ÷ 2 = 16 8 16 台服务器 x 8 个 GPU/服务器 = 128 个 GPU
QFX5230-64CD 64 64 ÷ 2 = 32 8 32 台服务器 x 8 个 GPU/服务器 = 256 个 GPU
QFX5240-64OD 128 128 ÷ 2 = 64 8 64 台服务器 x 8 个 GPU/服务器 = 512 个 GPU
  • QFX5220-32CD 交换机提供 32 个 400 GE 端口(16 个用于连接到服务器,16 个用于连接到主干节点)
  • QFX5230-64CD 交换机提供多达 64 个 400 GE 端口(32 个用于连接到服务器,32 个用于连接到主干节点)。
  • QFX5240-64OD 交换机提供多达 128 个 400 GE 端口(64 个用于连接到服务器,64 个用于连接到主干节点)。
注意:QFX5240-64OD 交换机配有 64 个 800GE 端口,可拆分为 2 个 400GE 端口,最多 128 个 400GE 接口如表 7 所示。
  • 为了实现更大的规模,可以使用一组主干节点 (N4) 连接多个条带 (N3),如图 10 所示。

图 10:跨主干节点连接的多个条带。

所需的条带数量是根据所需的 GPU 数量以及每个条带支持的 GPU 数量计算得出的。

例如,假设所需的 GPU (GPU) 数量为 16,000,并且交换矩阵使用 QFX5240-64OD 作为叶节点。

可用 400G 端口数为 128,这意味着:

  • 每个条带的最大服务器数 (N1) = 64
  • 每个条带的最大 GPU 数 (N2) = 512

所需的 条带数 (N3) 是通过潜水所需的 GPU 数量和每个条带的 GPU 数量计算得出的,如下所示:

N 3(条带数= GPU/ N 2(每个条带的最大 GPU 数)= 16000/256 ≈ 64 条带

  • 每个条带有 64 个条带和 256 个服务器,该群集可以提供 16,384 个 GPU。
  • 当 N2 = 72 和 N1 服务器 = 32 时,该群集可以提供 18432 个 GPU。
  • 每个条带有 64 个条带和 256 个服务器,该群集可以提供 16,384 个 GPU。

知道 所需的条带数N 3) 和 每个叶节点的上行链路端口数Y),您可以计算出需要多少个主干节点。

记住 X = Y = N1

首先,叶 节点总数 可以通过将 所需的条带数 乘以 8(每个条带的叶节点数)来计算。

叶节点总数 = N3 x 8 = 64 x 8 = 512

然后可以得到上 行链路总数 乘以 每个叶节点的上行链路数N1叶节点总数

上行链路总数 = N1 x N3 = 64 x 512 = 32768

然后,可以通过将上行链路总数除以每个主干节点上的可用端口数来确定所需的主干数量N4),就叶节点而言,这取决于用于主干角色的交换机型号。

所需主干数N4) = 32768 / 每个主干节点上的可用端口数

例如,如果主干节点为QFX5240,则 每个主干节点上的可用端口数 为 128。

表 8:两个条带的主干节点数。

主干节点

QFX 交换机型号

每台交换机的最大 400 GE 接口数 所需主干数 (N4),带 64 条条带
QFX5240-64OD 128 32768 ÷ 128 = 256
PTX10008 288 32768 ÷ 288 ~ 128