在第 3 层使用 DSCP 处理未标记流量的 PFC
概述
人工智能和机器学习在数据中心的应用正在迅速扩展。在处理 AI 和 ML 工作负载以及大型数据集时,一个关键挑战是处理数据的大小。将计算转移到图形处理单元 (GPU) 可以显著加快此任务的速度。但是,数据大小和模型(尤其是大型语言模型 (LLM) 的数据大小和模型)通常会超过单个 GPU 的内存容量。因此,您通常需要多个 GPU 才能实现合理的工作完成时间,尤其是在训练方面。
AI 数据中心的性能取决于所使用的 GPU 数量以及连接它们的网络的效率。网络速度减慢可能导致 GPU 利用率不足和作业完成时间延长。基于以太网的网络作为 InfiniBand 的替代 AI 数据中心网络正变得越来越流行。一种解决方案是通过聚合以太网版本 2 (RoCEv2) 网络实现远程直接内存访问 (RDMA)。
RoCEv2 涉及将 RDMA 协议数据包封装在 UDP 数据包中,以便通过以太网网络进行传输。RoCEv2 协议利用基于优先级的流量控制 (PFC) 建立无丢弃网络,而 数据中心量化拥塞通知 (DCQCN) 为 RoCEv2 提供端到端拥塞控制。Junos OS 演化版通过结合显式拥塞通知 (ECN) 和 PFC 来支持 DCQCN,以实现端到端无损的 AI 以太网网络。
为了跨第 3 层 (L3) 连接到第 2 层 (L2) 子网支持无损 IPv6 流量,可以将 PFC 配置为使用未标记 VLAN 流量的 L3 标头中的 6 位差分服务代码点 (DSCP) 值运行。您可以将 PFC 与 DSCP 配合使用,作为 L2 VLAN 标记数据包标头中 IEEE 802.1p 优先级值的替代方法。您需要基于 DSCP 的 PFC 来支持 RoCEv2。
好处
-
将基于以太网的网络用于 AI-ML 数据中心联网。
-
提高大型数据集的网络效率。
-
实现端到端无损 AI-ML 以太网网络。
平台支持
请参阅 功能浏览器 ,了解平台和版本支持。