Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

在第 3 层使用 DSCP 处理未标记流量的 PFC

概述

人工智能和机器学习在数据中心的应用正在迅速扩展。在处理 AI 和 ML 工作负载以及大型数据集时,一个关键挑战是处理数据的大小。将计算转移到图形处理单元 (GPU) 可以显著加快此任务的速度。但是,数据大小和模型(尤其是大型语言模型 (LLM) 的数据大小和模型)通常会超过单个 GPU 的内存容量。因此,您通常需要多个 GPU 才能实现合理的工作完成时间,尤其是在训练方面。

AI 数据中心的性能取决于所使用的 GPU 数量以及连接它们的网络的效率。网络速度减慢可能导致 GPU 利用率不足和作业完成时间延长。基于以太网的网络作为 InfiniBand 的替代 AI 数据中心网络正变得越来越流行。一种解决方案是通过聚合以太网版本 2 (RoCEv2) 网络实现远程直接内存访问 (RDMA)。

RoCEv2 涉及将 RDMA 协议数据包封装在 UDP 数据包中,以便通过以太网网络进行传输。RoCEv2 协议利用基于优先级的流量控制 (PFC) 建立无丢弃网络,而 数据中心量化拥塞通知 (DCQCN) 为 RoCEv2 提供端到端拥塞控制。Junos OS 演化版通过结合显式拥塞通知 (ECN) 和 PFC 来支持 DCQCN,以实现端到端无损的 AI 以太网网络。

为了跨第 3 层 (L3) 连接到第 2 层 (L2) 子网支持无损 IPv6 流量,可以将 PFC 配置为使用未标记 VLAN 流量的 L3 标头中的 6 位差分服务代码点 (DSCP) 值运行。您可以将 PFC 与 DSCP 配合使用,作为 L2 VLAN 标记数据包标头中 IEEE 802.1p 优先级值的替代方法。您需要基于 DSCP 的 PFC 来支持 RoCEv2。

好处

  • 将基于以太网的网络用于 AI-ML 数据中心联网。

  • 提高大型数据集的网络效率。

  • 实现端到端无损 AI-ML 以太网网络。

配置

启用基于 DSCP 的 PFC

  1. 使用语pfc-priority句将转发类 (FC) 映射到 PFC 优先级。
  2. 定义拥塞通知配置文件,以对由 6 位 DSCP 值指定的流量启用 PFC。将code-point配置映射到无丢失队列。
  3. 为 DSCP 值和 PFC 映射的 FC 设置分类器。

验证配置

  1. 检查入口端口。
  2. 检查入口端口。
  3. 显示基于 DSCP 的输入 CNP。
  4. 显示将哪些 FC 映射到每个 PFC 优先级。

平台支持

请参阅 功能浏览器 ,了解平台和版本支持。