网络连接：参考示例 |瞻博网络

前端网络连接

前端交换矩阵设计为第 3 层 IP 交换矩阵，其中叶节点和主干节点之间的链路配置了 /31 IP 地址，如表 26 所示。交换矩阵由 2 个主干节点和 2 个叶节点组成，其中 1 个叶节点用于连接到存储服务器（命名为 frontend-weka-leaf 1）， 1 个用于连接到 GPU 服务器（命名为 frontend-ai-leaf1）。 此外，执行 AI 训练和推理模型的工作负载管理器（Slurm）的前端服务器也驻留在此交换矩阵中。

在此示例中，连接到前端交换矩阵中 GPU 服务器的叶节点被命名为 frontend-ai-leaf# 而不是 frontend-gpu-leaf# ，但它们代表相同的角色。

每个 frontend-weka-leaf 1 节点和主干节点之间有两个 400GE 链路，每个 frontend-ai-leaf1 节点和主干节点之间有两个 400GE 链路，如图 71 所示。

图 71：前端主干到叶节点的连接 A diagram of a computer network Description automatically generated

表 26：前端接口地址

主干节点	叶节点	主干 IP 地址	分叶 IP 地址
*前端-主干1*	*前端-ai-leaf1*	10.0.5.0/31 10.0.5.2/31	10.0.5.1/31 10.0.5.3/31
*前端-主干1*	*前端-weka-leaf1*	10.0.5.4/31 10.0.5.6/31	10.0.5.5/31 10.0.5.7/31
*前端-主干2*	*前端-ai-leaf1*	10.0.5.8/31 10.0.5.10/31	10.0.5.9/31 10.0.5.11/31
*前端-主干2*	*前端-weka-leaf1*	10.0.5.12/31 10.0.5.14/31	10.0.5.13/31 10.0.5.15/31

注意：所有自治系统和 IP 地址均由 Apstra 根据意图（来自预定义的资源池）分配。

环路接口还具有 Apstra 从预定义池中自动分配的地址。

表 27：前端环路地址

设备	环路接口地址
*前端-主干1*	10.0.3.0/32
*前端-主干2*	10.0.3.1/32
*前端-ai-leaf1*	10.0.1.0/32
*前端-weka-leaf1*	10.0.1.1/32

H100 GPU 服务器和 A100 GPU 服务器都连接到前端 ai-leaf1 节点。

GPU 服务器和叶节点叶 1 之间的链路被分配了 10.0.5.0/24 中的 /31 个子网，如图 72 和表 28 所示。

图 72：前端叶节点到 GPU 服务器的连接 A computer screen shot of a computer Description automatically generated

表 28：前端叶节点到 GPU 服务器接口地址

GPU 服务器	叶节点	GPU 服务器 IP 地址	叶 IP 地址
H100 GPU 服务器 1	*前端-ai-leaf1*	10.10.1.17/31	10.100.1.9/31
H100 GPU 服务器 2		10.10.1.19/31	10.100.1.11/31
H100 GPU 服务器 3		10.10.1.21/31	10.100.1.1/31
H100 GPU 服务器 4		10.10.1.23/31	10.100.1.3/31
A100 GPU 服务器 1		10.10.1.1/31	10.100.1.5/31
A100 GPU 服务器 2		10.10.1.3/31	10.100.1.7/31
A100 GPU 服务器 3		10.10.1.5/31	10.100.2.9/31
A100 GPU 服务器 4		10.10.1.7/31	10.100.2.11/31
A100 GPU 服务器 5		10.10.1.9/31	10.100.2.1/31
A100 GPU 服务器 6		10.10.1.11/31	10.100.2.3/31
A100 GPU 服务器 7		10.10.1.13/31	10.100.2.5/31
A100 GPU 服务器 8		10.10.1.15/31	10.100.2.7/31

WEKA 存储服务器都连接到 frontend-weka-leaf 1 节点。

指向这些服务器的链路没有在叶节点上分配 IP 地址。通过地址不在子网 10.10.2.1/24 的 IRB 接口提供第 3 层连接。WEKA 服务器的地址来自 10.10.2.0/24，如图 73 和表 29 所示。

图 73：前端叶节点到 WEKA 存储 A screenshot of a computer Description automatically generated 连接

表 29：前端叶节点到 WEKA 存储接口地址

GPU 服务器	叶节点	WEKA 服务器 IP 地址	叶 IP 地址
WEKA 存储服务器 1	*前端-weka-leaf1*	10.10.2.2/24	10.10.2.1/24 （IRB.2）
WEKA 存储服务器 2		10.10.2.3/24
WEKA 存储服务器 3		10.10.2.4/24
WEKA 存储服务器 4		10.10.2.5/24
WEKA 存储服务器 5		10.10.2.6/24
WEKA 存储服务器 6		10.10.2.7/24
WEKA 存储服务器 7		10.10.2.8/24
WEKA 存储服务器 8		10.10.2.9/24

执行工作负载管理器的前端服务器都连接到 frontend-ai-leaf1 节点。

指向这些服务器的链路没有在叶节点上分配 IP 地址。通过地址为 10.10.3.1/24 的 IRB 接口提供第 3 层连接。前端服务器分配的地址超出了 10.10.3.0/24，如下表所示。

图 74：前端叶节点到前端服务器的连接

A screenshot of a computer Description automatically generated

EBGP 配置在分配给主干叶节点链路的 IP 地址之间。 frontend-ai-leaf# 节点和每个主干节点之间将有 2 个 EBGP 会话，每个 frontend-weka-leaf # 节点和每个主干节点之间将有 2 个 EBGP 会话，如图 75 所示。

图 75：前端 EBGP

A diagram of a computer server Description automatically generated

表 30：前端会话

主干节点	叶节点	主干	分叶 ASN	主干 IP 地址	叶 IP 地址
*前端-主干1*	*前端-ai-leaf1*	4201032300	4201032400	10.0.5.0/31 10.0.5.2/31	10.0.5.1/31 10.0.5.3/31
*前端-主干1*	*前端 weka-leaf* 1	4201032300	4201032401	10.0.5.4/31 10.0.5.6/31	10.0.5.4/31 10.0.5.7/31
*前端-主干2*	*前端-ai-leaf1*	4201032301	4201032400	10.0.5.8/31 10.0.5.10/31	10.0.5.9/31 10.0.5.11/31
*前端-主干2*	*前端 weka-leaf* 1	4201032301	4201032401	10.0.5.12/31 10.0.5.14/31	10.0.5.13/31 10.0.5.15/31

在 frontend-ai-leaf1 节点上，Apstra 配置了 BGP 策略，以向主干节点播发以下路由：

注意：所有自治系统和社区值均由 Apstra 根据意图（来自预定义的资源池）分配。

frontend-ai-leaf1 节点自己的环路接口地址，
frontend-ai-leaf1 节点到主干接口、子网和
GPU 服务器到 frontend-ai-leaf1 节点链接子网。
WEKA 服务器的管理子网

图 76：前端叶到 GPU 服务器 BGP

A computer screen shot of a diagram Description automatically generated

图 77：前端叶到前端服务器 BGP

A screenshot of a computer Description automatically generated

表 31：前端叶到 GPU/头端服务器通告的路由

对

叶节点	等方	通告路由	BGP 社区
*前端-ai-leaf1*	*frontend-spine1 和前端-spine2*	环路： 10.0.4.0/32 叶脊式链路： 10.0.5.0/31 10.0.5.2/31 10.0.5.8/31 10.0.5.10/31	GPU 服务器 <=> 前端主干链路： 10.10.1.16/31 10.10.1.18/31 10.10.1.20/31 10.10.1.22/31 10.10.1.0/31 10.10.1.2/31 10.10.1.4/31 10.10.1.6/31 10.10.1.8/31 10.10.1.10/31 10.10.1.12/31 10.10.1.14/31 WEKA 管理服务器的子网： 10.10.3.0/24	3:20007 21001:26000

叶节点

等方

通告路由

BGP 社区

前端-ai-leaf1

frontend-spine1 和前端-spine2

环路：

10.0.4.0/32

叶脊式链路：

10.0.5.0/31

10.0.5.2/31

10.0.5.8/31

10.0.5.10/31

GPU 服务器 <=> 前端主干链路：

10.10.1.16/31

10.10.1.18/31

10.10.1.20/31

10.10.1.22/31

10.10.1.0/31

10.10.1.2/31

10.10.1.4/31

10.10.1.6/31

10.10.1.8/31

10.10.1.10/31

10.10.1.12/31

10.10.1.14/31

WEKA 管理服务器的子网：

10.10.3.0/24

3:20007

21001:26000

在前端 weka-leaf 1 节点上，Apstra 配置了 BGP 策略，以向主干节点通告以下路由：

frontend-weka-leaf 1 个节点自己的环路接口地址，
frontend-weka-leaf 1 个节点到主干接口、子网和
WEKA 存储服务器的子网

图 78：前端叶式到 WEKA 存储 BGP

A screenshot of a computer Description automatically generated

表 32：前端叶式到 Weka 存储的通告路由

对

叶节点	等方	通告路由	BGP 社区
*前端 weka-leaf* 1	*frontend-spine1* 和 *前端-主干2*	环路： 10.0.4.1/32 叶脊式链路： 10.0.5.4/31 10.0.5.6/31 10.0.5.12/31 10.0.5.14/31	GPU 服务器 <=> 前端主干链路： 10.10.2.0/24	4:20007 21001:26000

叶节点

等方

通告路由

BGP 社区

前端 weka-leaf 1

frontend-spine1 和

前端-主干2

环路：

10.0.4.1/32

叶脊式链路：

10.0.5.4/31

10.0.5.6/31

10.0.5.12/31

10.0.5.14/31

GPU 服务器 <=> 前端主干链路：

10.10.2.0/24

4:20007

21001:26000

在主干节点上，Apstra 配置了 BGP 策略，以将以下路由播发到前端人工智能叶节点：

前端-主干节点自己的环路接口地址
frontend-weka-leaf 1 环路接口地址
frontend-主干到frontend-weka-leaf 1节点接口子网
WEKA 存储服务器的子网（从 frontend-weka-leaf 1 中学习）

图 79：GPU/头服务器 BGP A screenshot of a computer Description automatically generated 的前端主干到前端叶

表 33：GPU/头服务器的前端主干到前端叶通告路由

对

叶节点	等方	通告路由	BGP 社区
*前端-主干1*	*前端人工智能叶*	环路： 10.0.3.0/32 10.0.4.0/32 叶脊式链路： 10.0.5.0/31 10.0.5.2/31 10.0.5.4/31 10.0.5.6/31 10.0.5.12/31 10.0.5.14/31	WEKA 服务器子网： 10.10.2.0/24	0:15 1:20007 21001:26000 10.0.4.0/32 除外 (0:15 3:20007 21001:26000)
*前端-主干2*	*前端人工智能叶*	环路： 10.0.3.1/32 10.0.4.0/32 叶脊式链路： 10.0.5.4/31 10.0.5.6/31 10.0.5.8/31 10.0.5.10/31 10.0.5.12/31 10.0.5.14/31	WEKA 服务器子网： 10.10.2.0/24	0:15 2:20007 21001:26000 10.0.4.0/32 除外 (0:15 3:20007 21001:26000)

叶节点

等方

通告路由

BGP 社区

前端-主干1

前端人工智能叶

环路：

10.0.3.0/32

10.0.4.0/32

叶脊式链路：

10.0.5.0/31

10.0.5.2/31

10.0.5.4/31

10.0.5.6/31

10.0.5.12/31

10.0.5.14/31

WEKA 服务器子网：

10.10.2.0/24

0:15

1:20007

21001:26000

10.0.4.0/32 除外

(0:15 3:20007 21001:26000)

前端-主干2

前端人工智能叶

环路：

10.0.3.1/32

10.0.4.0/32

叶脊式链路：

10.0.5.4/31

10.0.5.6/31

10.0.5.8/31

10.0.5.10/31

10.0.5.12/31

10.0.5.14/31

WEKA 服务器子网：

10.10.2.0/24

0:15

2:20007

21001:26000

10.0.4.0/32 除外

(0:15 3:20007 21001:26000)

在主干节点上，Apstra 配置了 BGP 策略，以将以下路由播发至前端 weka-leaf 1 叶节点：

主干节点自己的环路接口地址
frontend-ai-leaf1 环路接口地址
主干到前端 AI-Leaf1 节点、接口、子网
GPU 服务器到 frontend-ai-leaf1 节点链路子网

图 80：WEKA 存储前端服务器 BGP 的前端主干到前端叶

A screenshot of a computer Description automatically generated

图 81：WEKA 存储 GPU 服务器 BGP 的前端主干到前端叶

A computer screen shot of a diagram Description automatically generated

表 34 WEKA 存储的前端主干到前端叶通告路由

对

叶节点	等方	通告路由	BGP 社区
*前端-主干1*	*前端人工智能叶*	环路： 10.0.3.0/32 10.0.4.1/32 叶脊式链路： 10.0.5.0/31 10.0.5.2/31 10.0.5.4/31 10.0.5.6/31 10.0.5.8/31 10.0.5.10/31	GPU 服务器 <=> 前端主干链路： 10.10.1.16/31 10.10.1.18/31 10.10.1.20/31 10.10.1.22/31 10.10.1.0/31 10.10.1.2/31 10.10.1.4/31 10.10.1.6/31 10.10.1.8/31 10.10.1.10/31 10.10.1.12/31 10.10.1.14/31 WEKA 服务器的管理子网： 10.10.3.0/24	0:15 1:20007 21001:26000 10.0.4.1/32 除外 (0:15 4:20007 21001:26000)
*前端-主干2*	*前端人工智能叶*	环路： 10.0.3.1/32 10.0.4.1/32 叶脊式链路： 10.0.5.0/31 10.0.5.2/31 10.0.5.8/31 10.0.5.10/31 10.0.5.12/31 10.0.5.14/31	GPU 服务器 <=> 前端主干链路： 10.10.1.16/31 10.10.1.18/31 10.10.1.20/31 10.10.1.22/31 10.10.1.0/31 10.10.1.2/31 10.10.1.4/31 10.10.1.6/31 10.10.1.8/31 10.10.1.10/31 10.10.1.12/31 10.10.1.14/31 WEKA 管理服务器的子网： 10.10.3.0/24	0:15 2:20007 21001:26000 10.0.4.1/32 除外 (0:15 4:20007 21001:26000)

叶节点

等方

通告路由

BGP 社区

前端-主干1

前端人工智能叶

环路：

10.0.3.0/32

10.0.4.1/32

叶脊式链路：

10.0.5.0/31

10.0.5.2/31

10.0.5.4/31

10.0.5.6/31

10.0.5.8/31

10.0.5.10/31

GPU 服务器 <=> 前端主干链路：

10.10.1.16/31

10.10.1.18/31

10.10.1.20/31

10.10.1.22/31

10.10.1.0/31

10.10.1.2/31

10.10.1.4/31

10.10.1.6/31

10.10.1.8/31

10.10.1.10/31

10.10.1.12/31

10.10.1.14/31

WEKA 服务器的管理子网：

10.10.3.0/24

0:15

1:20007

21001:26000

10.0.4.1/32 除外

(0:15 4:20007 21001:26000)

前端-主干2

前端人工智能叶

环路：

10.0.3.1/32

10.0.4.1/32

叶脊式链路：

10.0.5.0/31

10.0.5.2/31

10.0.5.8/31

10.0.5.10/31

10.0.5.12/31

10.0.5.14/31

GPU 服务器 <=> 前端主干链路：

10.10.1.16/31

10.10.1.18/31

10.10.1.20/31

10.10.1.22/31

10.10.1.0/31

10.10.1.2/31

10.10.1.4/31

10.10.1.6/31

10.10.1.8/31

10.10.1.10/31

10.10.1.12/31

10.10.1.14/31

WEKA 管理服务器的子网：

10.10.3.0/24

0:15

2:20007 21001:26000

10.0.4.1/32 除外

(0:15 4:20007 21001:26000)

通过播发分配给叶节点与 GPU/存储服务器之间链路的子网，GPU 与 WEKA 存储和 WEKA 管理服务器之间的通信可以在整个交换矩阵中实现。

图 82：GPU 服务器到 WEKA 存储和 WEKA 管理服务器 A diagram of a computer network Description automatically generated

所有设备均配置为执行 ECMP 负载平衡，如本文档后面所述。

GPU 后端网络连接

GPU 后端交换矩阵设计为第 3 层 IP 交换矩阵，其中叶节点和主干节点之间的链路配置了 /31 IP 地址并运行 EBGP。交换矩阵由 2 个主干节点和 8 个主干节点（每个条带）组成。

每个叶节点和主干节点之间都有一个 400GE 链路。

图 83：GPU 后端主干到 GPU 后端叶节点的连接 A computer screen shot of a diagram Description automatically generated

表 35：GPU 后端接口地址

条带 #	主干节点	叶节点	主干 IP 地址	叶 IP 地址
1	*GPU 后端主干* 1	*GPU-后端-叶 1*	10.0.2.0/31 10.0.2.2/31	10.0.2.1/31 10.0.2.3/31
1	*GPU 后端主干* 1	*GPU-后端-叶式 2*	10.0.2.4/31 10.0.2.6/31	10.0.2.5/31 10.0.2.7/31
1	*GPU 后端主干* 1	*GPU-后端-叶式 3*	10.0.2.8/31 10.0.2.10/31	10.0.2.9/31 10.0.2.11/31
. . .
1	*GPU-后端-主干* 2	*GPU-后端-叶 1*	10.0.2.64/31 10.0.2.66/31	10.0.2.65/31 10.0.2.67/31
1	*GPU-后端-主干* 2	*GPU-后端-叶式 2*	10.0.2.68/31 10.0.2.70/31	10.0.2.69/31 10.0.2.71/31
1	*GPU-后端-主干* 2	*GPU-后端-叶式 3*	10.0.2.72/31 10.0.2.74/31	10.0.2.73/31 10.0.2.75/31

环路接口还具有 Apstra 从预定义池中自动分配的地址。

注意：所有 IP 地址均由 Apstra 根据意图（从预定义的资源池中）分配。

表 36：GPU 后端环路地址

条带 #	设备	环路接口地址
1	*GPU-后端-主干1*	10.0.0.0/32
1	*GPU-后端-主干 2*	10.0.0.1/32
1	*GPU-后端-叶 1*	10.0.1.0/32
1	*GPU-后端-叶式 2*	10.0.1.1/32
1	*GPU-后端-叶式 3*	10.0.1.2/32

系统会为每个叶节点分配一个 /24 子网（满分 10.200/16）和一个唯一的 VLAN ID，以提供与 GPU 服务器的连接。第 3 层连接通过具有特定 IP 子网之外地址的 IRB 接口提供，如下表所示。

由于每个叶节点代表一个轨道，所有具有给定编号的 GPU 都在其中连接，因此群集中的每个轨道都映射到不同的 /24 IP 子网。

图 84：GPU 后端服务器到叶节点的连接 A computer screen shot of a computer Description automatically generated

表 37：GPU 后端服务器到叶节点的连接

叶的

条带 #	设备	轨道 #	VLAN #	连接设备上	子网	IRB
1	*GPU-后端-叶* 1	1	2	10.200.0.0/24	10.200.0.254	GPU 1 来自所有 8 台 GPU 服务器
1	*GPU-后端-叶* 2	2	3	10.200.1.0/24	10.200.1.254	GPU 2 个，来自 8 台 GPU 服务器
1	*GPU-后端-叶式* 3	3	4	10.200.2.0/24	10.200.2.254	GPU 3 个，来自 8 个 GPU 服务器
. . .

EBGP 配置在分配给主干叶节点链路的 IP 地址之间，如图 81 所示。每个 gpu-backend-leaf # 节点和每个 gpu-backend-主干 # 之间将有 2 个 EBGP 会话。

图 85：GPU 后端 BGP 会话

A screenshot of a computer program Description automatically generated

表 38：GPU 后端会话

条带 #	主干节点	叶节点	主干 ASN	叶 ASN 主	干 IP 地址	叶 IP 地址
1	*GPU-后端-主干1*	*GPU-后端-叶 1*	4201032100	4201032200	10.0.2.0/31 10.0.2.2/31	10.0.2.1/31 10.0.2.3/31
1	*GPU-后端-主干1*	*GPU-后端-叶式 2*		4201032201	10.0.2.4/31 10.0.2.6/31	10.0.2.5/31 10.0.2.7/31
1	*GPU-后端-主干1*	*GPU-后端-叶式 3*		4201032202	10.0.2.8/31 10.0.2.10/31	10.0.2.9/31 10.0.2.11/31
	。 . . .
1	*GPU-后端-主干 2*	*GPU-后端-叶 1*	4201032101	4201032200	10.0.2.64/31 10.0.2.66/31	10.0.2.65/31 10.0.2.67/31
1	*GPU-后端-主干 2*	*GPU-后端-叶式 2*		4201032201	10.0.2.68/31 10.0.2.70/31	10.0.2.69/31 10.0.2.71/31
1	*GPU-后端-主干 2*	*GPU-后端-叶式 3*		4201032202	10.0.2.72/31 10.0.2.74/31	10.0.2.73/31 10.0.2.75/31
	. . . .

所有自治系统和社区值均由 Apstra 根据意图（来自预定义的资源池）分配。

在叶节点上，Apstra 配置了 BGP 策略，以向主干节点播发以下路由：

叶节点自己的环路接口地址
叶到主干接口、子网和
IRB 接口子网

图 86：GPU 后端叶节点 BGP

A screenshot of a computer Description automatically generated

表 39：GPU 后端叶节点通告的路由

Stripe #	设备	通告路由	BGP 社区
1	*GPU-后端-叶* 1	10.0.1.0/32 10.0.2.0/31 10.0.2.64/31 10.200.0.0/24	3:20007 21001:26000
1	*GPU-后端-叶* 2	10.0.1.1/32 10.0.2.4/31 10.0.2.68/31 10.200.1.0/24	4:20007 21001:26000
1	*GPU-后端-叶式* 3	10.0.1.2/32 10.0.2.8/31 10.0.2.72/31 10.200.2.0/24	5:20007 21001:26000

Stripe #

设备

通告路由

BGP 社区

1

GPU-后端-叶 1

10.0.1.0/32

10.0.2.0/31

10.0.2.64/31

10.200.0.0/24

3:20007

21001:26000

1

GPU-后端-叶 2

10.0.1.1/32

10.0.2.4/31

10.0.2.68/31

10.200.1.0/24

4:20007

21001:26000

1

GPU-后端-叶式 3

10.0.1.2/32

10.0.2.8/31

10.0.2.72/31

10.200.2.0/24

5:20007

21001:26000

在主干节点上，Apstra 配置了 BGP 策略，以向叶节点播发以下路由：

主干节点自己的环路接口地址
叶节点的环路接口地址
主干到叶接口子网
IRB 接口子网中，如下所示：

图 87：GPU 后端主干节点 BGP

A screenshot of a computer Description automatically generated

表 40：GPU 后端主干节点通告的路由

通

Stripe #	主干节点	告路由	BGP 社区
1	*GPU 后端主干* 1	10.0.0.0/32 10.0.2.0/31 10.0.2.4/31 … 10.200.1.0/24 …	0：15 X：20007 21001:26000
1	*GPU-后端-主干* 2	10.0.0.1/32 10.0.2.64/31 10.0.2.68/31 … 10.200.1.0/24 …	0：15 X：20007 21001:26000

Stripe #

主干节点

告路由

BGP 社区

1

GPU 后端主干 1

10.0.0.0/32

10.0.2.0/31

10.0.2.4/31 …

10.200.1.0/24 …

0：15 X：20007

21001:26000

1

GPU-后端-主干 2

10.0.0.1/32

10.0.2.64/31

10.0.2.68/31 …

10.200.1.0/24 …

0：15 X：20007

21001:26000

通过播发 IRB 接口子网，不同轨道中的 GPU 之间可以跨交换矩阵进行通信。

图 88：跨轨道通信

A diagram of a computer network Description automatically generated

所有设备均配置为执行 ECMP 负载平衡，如本文档后面所述。

存储后端网络连接

存储后端交换矩阵设计为第 3 层 IP 交换矩阵，其中叶节点和主干节点之间的链路配置为 /31 IP 地址，如下表所示。交换矩阵由 2 个主干节点和 4 个叶节点组成，其中 2 个叶节点用于连接存储服务器（名为 storage-backend-weka-leaf #）， 2 个用于连接 GPU 服务器（名为 storage-backend-gpu-leaf #）。

每个存储后端 weka-leaf # 节点和主干节点之间有三个 400GE 链路，每个存储后端 gpu-leaf # 节点和主干节点之间有两个 400GE 链路，如图 89 所示。

图 89 ：存储后端主干到存储后端 GPU 叶节点的连接

A computer screen shot of a diagram Description automatically generated

图 90：存储后端主干到存储后端 WEKA 存储叶节点连接

A diagram of storage and storage Description automatically generated

表 41：存储后端接口地址

主干节点	叶节点	主干 IP 地址	叶 IP 地址
*存储后端主干* 1	*存储-后端-gpu-叶* 1	10.0.8.0/31 10.0.8.2/31 10.0.8.4/31	10.0.8.1/31 10.0.8.3/31 10.0.8.5/31
*存储-后端-主干1*	*存储-后端-gpu-leaf2*	10.0.8.6/31 10.0.8.8/31 10.0.8.10/31	10.0.8.7/31 10.0.8.9/31 10.0.8.11/31
*存储-后端-主干1*	*存储-后端-weka-leaf1*	10.0.8.12/31 10.0.8.14/31	10.0.8.13/31 10.0.8.15/31
*存储-后端-主干1*	*存储后端-weka-leaf2*	10.0.8.16/31 10.0.8.18/31	10.0.8.17/31 10.0.8.19/31
*存储-后端-主干2*	*存储-后端-gpu-leaf1*	10.0.8.20/31 10.0.8.22/31 10.0.8.24/31	10.0.8.21/31 10.0.8.23/31 10.0.8.25/31
*存储-后端-主干2*	*存储-后端-gpu-leaf2*	10.0.8.26/31 10.0.8.28/31 10.0.8.30/31	10.0.8.27/31 10.0.8.29/31 10.0.8.31/31
*存储-后端-主干2*	*存储-后端-weka-leaf1*	10.0.8.32/31 10.0.8.34/31	10.0.8.33/31 10.0.8.35/31
*存储-后端-主干2*	*存储后端-weka-leaf2*	10.0.8.36/31 10.0.8.38/31	10.0.8.37/31 10.0.8.39/31

注意：所有 IP 地址均由 Apstra 根据意图（从预定义的资源池中）分配。

环路接口还具有 Apstra 从预定义池中自动分配的地址。

表 42：存储后端环路接口

设备	环路接口地址
*存储-后端-主干1*	10.0.6.0/32
*存储-后端-主干2*	10.0.6.1/32
*存储-后端-gpu-leaf1*	10.0.7.0/32
*存储-后端-gpu-leaf2*	10.0.7.1/32
*存储-后端-weka-leaf1*	10.0.7.2/32
*存储后端-weka-leaf2*	10.0.7.3/32

H100 GPU 服务器和 A100 GPU 服务器连接到存储后端叶交换机，如下表所示。

表 43：存储 GPU 后端服务器到叶节点的连接

叶

GPU 服务器	节点
*H100-1*	*存储-后端-gpu-leaf1*
*H100-2*
*A100-1*
*A100-2*
*A100-3*
*A100-4*
*H100-3*	*存储-后端-gpu-leaf2*
*H100-4*
*A100-5*
*A100-6*
*A100-7*
*A100-8*

GPU 服务器和 storage-backend-gpu-leaf 1 之间的链接被分配了 10.100.1/24 中的 /31 个子网，而 GPU 服务器和 storage-backend-gpu-leaf 2 之间的链接被分配了 10.100.2/24 中的 /31 个子网，如图 91 所示。

图 91：GPU 服务器到存储后端 GPU 叶节点的连接

A screenshot of a computer Description automatically generated

表 44：GPU 服务器到存储 GPU 后端接口地址

GPU 服务器	叶节点	GPU 服务器 IP 地址	叶 IP 地址
*H100 GPU 服务器 1*	*存储-后端-gpu-叶* 1	10.100.1.8/31	10.100.1.9/31
*H100 GPU 服务器 2*	*存储-后端-gpu-叶* 1	10.100.1.10/31	10.100.1.11/31
*A100 GPU 服务器 1*	*存储-后端-gpu-叶* 1	10.100.1.0/31	10.100.1.1/31
*A100 GPU 服务器 2*	*存储-后端-gpu-叶* 1	10.100.1.2/31	10.100.1.3/31
*A100 GPU 服务器 3*	*存储-后端-gpu-叶* 1	10.100.1.4/31	10.100.1.5/31
*A100 GPU 服务器 4*	*存储-后端-gpu-叶* 1	10.100.1.6/31	10.100.1.7/31
*H100 GPU 服务器 3*	*存储-后端-gpu-叶* 2	10.100.2.8/31	10.100.2.9/31
*H100 GPU 服务器 4*	*存储-后端-gpu-叶* 2	10.100.2.10/31	10.100.2.11/31
*A100 GPU 服务器 5*	*存储-后端-gpu-叶* 2	10.100.2.0/31	10.100.2.1/31
*A100 GPU 服务器 6*	*存储-后端-gpu-叶* 2	10.100.2.2/31	10.100.2.3/31
*A100 GPU 服务器 7*	*存储-后端-gpu-叶* 2	10.100.2.4/31	10.100.2.5/31
*A100 GPU 服务器 8*	*存储-后端-gpu-叶* 2	10.100.2.6/31	10.100.2.7/31

与 GPU 服务器一样，WEKA 存储服务器连接到两个存储后端 weka-leaf # 节点，如图 92 所示。

图 92：WEKA 存储服务器到叶节点的连接

A screenshot of a computer Description automatically generated

每个 GPU 服务器到叶节点的连接都分配了一个 10.100.0.0/24 中的 /31 子网，如下表所示。

表 45：WEKA 存储服务器到叶节点接口地址

WEKA 服务器	叶节点	WEKA 服务器 IP 地址	叶 IP 地址
*WEKA 存储服务器 1*	*存储后端 weka-leaf* 1	10.100.0.0/31	10.100.0.1/31
*WEKA 存储服务器 2*	*存储后端 weka-leaf* 1	10.100.0.2/31	10.100.0.3/31
*WEKA 存储服务器 3*	*存储后端 weka-leaf* 1	10.100.0.4/31	10.100.0.5/31
*WEKA 存储服务器 4*	*存储后端 weka-leaf* 1	10.100.0.5/31	10.100.0.7/31
*WEKA 存储服务器 5*	*存储后端 weka-leaf* 1	10.100.0.8/31	10.100.0.9/31
*WEKA 存储服务器 6*	*存储后端 weka-leaf* 1	10.100.0.10/31	10.100.0.11/31
*WEKA 存储服务器 7*	*存储后端 weka-leaf* 1	10.100.0.12/31	10.100.0.13/31
*WEKA 存储服务器 8*	*存储后端 weka-leaf* 1	10.100.0.14/31	10.100.0.15/31

*WEKA 存储服务器 1*	*存储后端 weka-leaf* 1	10.100.0.16/31	10.100.0.17/31
*WEKA 存储服务器 2*	*存储后端 weka-leaf* 1	10.100.0.18/31	10.100.0.19/31
*WEKA 存储服务器 3*	*存储后端 weka-leaf* 1	10.100.0.20/31	10.100.0.21/31
*WEKA 存储服务器 4*	*存储后端 weka-leaf* 1	10.100.0.22/31	10.100.0.23/31
*WEKA 存储服务器 5*	*存储后端 weka-leaf* 1	10.100.0.24/31	10.100.0.25/31
*WEKA 存储服务器 6*	*存储后端 weka-leaf* 1	10.100.0.26/31	10.100.0.27/31
*WEKA 存储服务器 7*	*存储后端 weka-leaf* 1	10.100.0.28/31	10.100.0.29/31
*WEKA 存储服务器 8*	*存储后端 weka-leaf* 1	10.100.0.30/31	10.100.0.31/31

请注意，在这种情况下，叶节点使用物理接口连接到存储服务器。因此，此连接不会使用 IRB 接口或 VLAN ID。

EBGP 配置在分配给主干节点和叶节点之间链路的 IP 地址之间，如图 93 所示。

每个 storage-backend-weka-leaf # 节点和主干节点之间将有 3 个 EBGP 会话。同样，每个 storage-backend-gpu-leaf # 节点之间将有 2 个 EBGP 会话。

图 93：存储后端主干到存储后端为 GPU 服务器 EBGP

A screenshot of a computer Description automatically generated

图 94：存储后端主干到存储后端离开 WEKA 服务器 EBGP A diagram of storage and storage Description automatically generated

表 46：存储后端会话

主干节点	叶节点	主干 ASN	叶 ASN	主干 IP 地址	叶 IP 地址
*存储-后端-主干1*	*存储-后端-gpu-leaf1*	4201032500	4201032600	10.0.8.0/31 10.0.8.2/31 10.0.8.4/31	10.0.8.1/31 10.0.8.3/31 10.0.8.5/31
*存储-后端-主干1*	*存储-后端-gpu-leaf2*		4201032601	10.0.8.6/31 10.0.8.8/31 10.0.8.10/31	10.0.8.7/31 10.0.8.9/31 10.0.8.11/31
*存储-后端-主干1*	*存储-后端-weka-leaf1*		4201032602	10.0.8.12/31 10.0.8.14/31	10.0.8.13/31 10.0.8.15/31
*存储-后端-主干1*	*存储后端-weka-leaf2*		4201032603	10.0.8.16/31 10.0.8.18/31	10.0.8.17/31 10.0.8.19/31

*存储-后端-主干2*	*存储-后端-gpu-leaf1*	4201032501	4201032600	10.0.8.20/31 10.0.8.22/31 10.0.8.24/31	10.0.8.21/31 10.0.8.23/31 10.0.8.25/31
*存储-后端-主干2*	*存储-后端-gpu-leaf2*		4201032601	10.0.8.26/31 10.0.8.28/31 10.0.8.30/31	10.0.8.27/31 10.0.8.29/31 10.0.8.31/31
*存储-后端-主干2*	*存储-后端-weka-leaf1*		4201032602	10.0.8.32/31 10.0.8.34/31	10.0.8.33/31 10.0.8.35/31
*存储-后端-主干2*	*存储后端-weka-leaf2*		4201032603	10.0.8.36/31 10.0.8.38/31	10.0.8.37/31 10.0.8.39/31

在叶节点上，Apstra 配置了 BGP 策略，以向主干节点通告以下路由：

注意：所有自治系统和社区值均由 Apstra 根据意图（来自预定义的资源池）分配。

叶节点自己的环路接口地址，
叶到主干接口、子网和
GPU/WEKA 存储服务器到叶节点链路子网。

图 95：存储后端叶 BGP

A screenshot of a computer Description automatically generated

表 47：存储后端叶节点通告的路由

叶

节点	对等体	播发路由	BGP 社区
*存储-后端-gpu-leaf1*	*storage-backend-spine1 和* *存储-后端-主干2*	10.0.7.0/32 10.0.8.0/31 10.0.8.2/31 10.0.8.4/31 10.0.8.20/31 …	10.100.1.0/31 10.100.1.2/31 …	3:20007 21001:26000
*存储-后端-gpu-leaf2*	*storage-backend-spine1 和* *存储-后端-主干2*	10.0.7.1/32 10.0.8.6/31 10.0.8.8/31 10.0.8.10/31 10.0.8.26/31 …	10.100.2.0/31 10.100.2.2/31 …	4:20007 21001:26000
*存储-后端-weka-leaf1*	*storage-backend-spine1 和* *存储-后端-主干2*	10.0.7.2/32 10.0.8.12/31 10.0.8.14/31 10.0.8.32/31 …	10.100.0.16/31 10.100.0.18/31 …	5:20007 21001:26000
*存储后端-weka-leaf2*	*storage-backend-spine1 和* *存储-后端-主干2*	10.0.7.3/32 10.0.8.16/31 10.0.8.17/31 10.0.8.36/31 …	10.100.0.16/31 10.100.0.18/31 …	6:20007 21001:26000

节点

对等体

播发路由

BGP 社区

存储-后端-gpu-leaf1

storage-backend-spine1 和

存储-后端-主干2

10.0.7.0/32

10.0.8.0/31

10.0.8.2/31

10.0.8.4/31

10.0.8.20/31 …

10.100.1.0/31

10.100.1.2/31 …

3:20007

21001:26000

存储-后端-gpu-leaf2

storage-backend-spine1 和

存储-后端-主干2

10.0.7.1/32

10.0.8.6/31

10.0.8.8/31

10.0.8.10/31

10.0.8.26/31 …

10.100.2.0/31

10.100.2.2/31 …

4:20007

21001:26000

存储-后端-weka-leaf1

storage-backend-spine1 和

存储-后端-主干2

10.0.7.2/32

10.0.8.12/31

10.0.8.14/31

10.0.8.32/31 …

10.100.0.16/31

10.100.0.18/31 …

5:20007

21001:26000

存储后端-weka-leaf2

storage-backend-spine1 和

存储-后端-主干2

10.0.7.3/32

10.0.8.16/31

10.0.8.17/31

10.0.8.36/31 …

10.100.0.16/31

10.100.0.18/31 …

6:20007

21001:26000

在主干节点上，Apstra 配置了 BGP 策略，以向叶节点播发以下路由：

主干节点自己的环路接口地址
叶节点的环路接口地址
主干到叶接口子网
GPU/WEKA 存储服务器到叶节点链路子网。

图 96：存储后端主干 BGP

A screenshot of a computer Description automatically generated

表 48：存储后端主干节点通告的路由

主干节点	对等体	播发路由	BGP 社区
*存储-后端-主干1*	*存储-后端-gpu-leaf1*	10.0.6.0/32 10.0.7.1/32 10.0.7.2/32 10.0.7.3/32	10.0.8.6/31 10.0.8.8/31 10.0.8.10/31 10.0.8.12/31 10.0.8.14/31 …	10.100.0.0/31 10.100.0.2/31 … 10.100.2.0/31 10.100.2.2/31 …	3:20007 21001:26000
*存储-后端-gpu-leaf2*	10.0.6.0/32 10.0.7.0/32 10.0.7.2/32 10.0.7.3/32	10.0.8.0/31 10.0.8.2/31 10.0.8.4/31 10.0.8.12/31 10.0.8.14/31 …	10.100.0.0/31 10.100.0.2/31 … 10.100.1.0/31 10.100.1.2/31 …
*存储后端 weka-leaf 1*	10.0.6.0/32 10.0.7.0/32 10.0.7.1/32 10.0.7.3/32	10.0.8.0/31 10.0.8.2/31 10.0.8.4/31 …	10.100.0.0/31 10.100.0.2/31 … 10.100.1.0/31 10.100.1.2/31 … 10.100.2.0/31 10.100.2.2/31 …
*存储后端 weka-leaf 2*	10.0.6.0/32 10.0.7.0/32 10.0.7.1/32 10.0.7.2/32	10.0.8.0/31 10.0.8.2/31 10.0.8.4/31 10.0.8.20/31 …	10.100.0.0/31 10.100.0.2/31 … 10.100.1.0/31 10.100.1.2/31 … 10.100.2.0/31 10.100.2.2/31 …
*存储-后端-主干2*	*存储-后端-gpu-leaf1*	10.0.6.1/32 10.0.7.1/32 10.0.7.2/32 10.0.7.3/32	10.0.8.6/31 10.0.8.8/31 10.0.8.10/31 10.0.8.12/31 10.0.8.14/31 …	10.100.0.0/31 10.100.0.2/31 … 10.100.2.0/31 10.100.2.2/31 …	4:20007 21001:26000
*存储-后端-gpu-leaf2*	10.0.6.1/32 10.0.7.0/32 10.0.7.2/32 10.0.7.3/32	10.0.8.0/31 10.0.8.2/31 10.0.8.4/31 10.0.8.12/31 10.0.8.14/31 …	10.100.0.0/31 10.100.0.2/31 … 10.100.2.0/31 10.100.2.2/31 …
*存储后端 weka-leaf 1*	10.0.6.1/32 10.0.7.0/32 10.0.7.1/32 10.0.7.3/32	10.0.8.0/31 10.0.8.2/31 10.0.8.4/31 …	10.100.0.0/31 10.100.0.2/31 … 10.100.1.0/31 10.100.1.2/31 … 10.100.2.0/31 10.100.2.2/31 …
*存储后端 weka-leaf 2*	10.0.6.0/32 10.0.7.1/32 10.0.7.2/32 10.0.7.3/32	10.0.8.6/31 10.0.8.8/31 10.0.8.10/31 10.0.8.12/31 10.0.8.14/31 …	10.100.0.0/31 10.100.0.2/31 … 10.100.2.0/31 10.100.2.2/31 …

主干节点

对等体

播发路由

BGP 社区

存储-后端-主干1

存储-后端-gpu-leaf1

10.0.6.0/32

10.0.7.1/32

10.0.7.2/32

10.0.7.3/32

10.0.8.6/31

10.0.8.8/31

10.0.8.10/31

10.0.8.12/31

10.0.8.14/31 …

10.100.0.0/31

10.100.0.2/31 …

10.100.2.0/31

10.100.2.2/31 …

3:20007

21001:26000

存储-后端-gpu-leaf2

10.0.6.0/32

10.0.7.0/32

10.0.7.2/32

10.0.7.3/32

10.0.8.0/31

10.0.8.2/31

10.0.8.4/31

10.0.8.12/31

10.0.8.14/31 …

10.100.0.0/31

10.100.0.2/31 …

10.100.1.0/31

10.100.1.2/31 …

存储后端 weka-leaf 1

10.0.6.0/32

10.0.7.0/32

10.0.7.1/32

10.0.7.3/32

10.0.8.0/31

10.0.8.2/31

10.0.8.4/31 …

10.100.0.0/31

10.100.0.2/31 …

10.100.1.0/31

10.100.1.2/31 …

10.100.2.0/31

10.100.2.2/31 …

存储后端 weka-leaf 2

10.0.6.0/32

10.0.7.0/32

10.0.7.1/32

10.0.7.2/32

10.0.8.0/31

10.0.8.2/31

10.0.8.4/31

10.0.8.20/31 …

10.100.0.0/31

10.100.0.2/31 …

10.100.1.0/31

10.100.1.2/31 …

10.100.2.0/31

10.100.2.2/31 …

存储-后端-主干2

存储-后端-gpu-leaf1

10.0.6.1/32

10.0.7.1/32

10.0.7.2/32

10.0.7.3/32

10.0.8.6/31

10.0.8.8/31

10.0.8.10/31

10.0.8.12/31

10.0.8.14/31 …

10.100.0.0/31

10.100.0.2/31 …

10.100.2.0/31

10.100.2.2/31 …

4:20007

21001:26000

存储-后端-gpu-leaf2

10.0.6.1/32

10.0.7.0/32

10.0.7.2/32

10.0.7.3/32

10.0.8.0/31

10.0.8.2/31

10.0.8.4/31

10.0.8.12/31

10.0.8.14/31 …

10.100.0.0/31 10.100.0.2/31 …

10.100.2.0/31

10.100.2.2/31 …

存储后端 weka-leaf 1

10.0.6.1/32

10.0.7.0/32

10.0.7.1/32

10.0.7.3/32

10.0.8.0/31

10.0.8.2/31

10.0.8.4/31 …

10.100.0.0/31

10.100.0.2/31 …

10.100.1.0/31

10.100.1.2/31 …

10.100.2.0/31

10.100.2.2/31 …

存储后端 weka-leaf 2

10.0.6.0/32

10.0.7.1/32

10.0.7.2/32

10.0.7.3/32

10.0.8.6/31

10.0.8.8/31

10.0.8.10/31

10.0.8.12/31

10.0.8.14/31 …

10.100.0.0/31 10.100.0.2/31 …

10.100.2.0/31

10.100.2.2/31 …

通过播发分配给叶节点与 GPU/存储服务器之间链路的子网，GPU 与存储服务器之间的通信可以在整个交换矩阵中实现。

图 97：存储子网通告

A diagram of a computer server Description automatically generated

注意：所有设备都配置为执行 ECMP 负载平衡，如本文档后面所述。

本页内容

网络连接：参考示例

前端网络连接

GPU 后端网络连接

存储后端网络连接