PFC basado en DSCP para tráfico de capa 3 sin etiquetar
Puede configurar PFC basado en DSCP para que admita el comportamiento sin pérdida para el tráfico sin etiqueta a través de conexiones de capa 3 a subredes de capa 2 para protocolos como el acceso directo de memoria remota (RDMA) sobre Ethernet convergente versión 2 (RoCEv2).
Descripción general
Con PFC basada en DSCP, las tramas de pausa se generan para notificar al par que el vínculo está congestionado en función de un valor de punto de código de servicios distribuidos (DSCP) de 6 bits configurado en el encabezado IP de capa 3 del tráfico entrante, en lugar de un punto de código IEEE 802.1p de 3 bits en el encabezado de VLAN de capa 2.
Dado que PFC solo puede enviar tramas de pausa correspondientes a puntos de código de prioridad PFC, el valor DSCP configurado de 6 bits debe asignarse a una prioridad PFC de 3 bits para utilizarlo en tramas de pausa cuando se activa PFC basado en DSCP. La configuración de la asignación implica asignar el valor de prioridad PFC a una clase de reenvío sin pérdidas cuando se asigna la clase de reenvío a una cola, definir un perfil de notificación de congestión para habilitar PFC en el tráfico con el valor DSCP deseado y configurar un clasificador DSCP para asociar la clase de reenvío asignada a prioridades PFC (junto con la prioridad de pérdida) con el valor DSCP configurado en el que activar las tramas de pausa PFC.
El dispositivo par debe tener una PFC de salida y una cola de control de flujo correspondiente configurada para que coincida con la configuración de prioridad de PFC en el dispositivo.
Use el Explorador de características para confirmar la compatibilidad de plataforma y versión para características específicas.
PFC basado en DSCP para tráfico de capa 3 sin etiquetar en centros de datos de IA-ML
Las aplicaciones de IA y ML se están expandiendo rápidamente en los centros de datos. Cuando se trata de cargas de trabajo de IA y ML y grandes conjuntos de datos, un desafío crítico es manejar el tamaño de los datos. Descargar la computación a unidades de procesamiento gráfico (GPU) puede acelerar considerablemente esta tarea. Sin embargo, el tamaño de los datos y el modelo, especialmente con modelos de lenguaje grandes (LLM), a menudo superan la capacidad de memoria de una sola GPU. Como resultado, normalmente necesita varias GPU para lograr tiempos razonables de finalización del trabajo, especialmente para la capacitación.
El rendimiento de un centro de datos de IA depende de la cantidad de GPU que se utilicen y de la eficiencia de la red que los conecta. Las ralentizaciones en la red pueden llevar a una subutilización de las GPU y a tiempos de finalización de trabajos más largos. Las redes basadas en Ethernet se están volviendo más populares como una alternativa a InfiniBand para redes de centros de datos de IA. Una solución es la red de acceso directo de memoria remota (RDMA) a través de Ethernet convergente versión 2 (RoCEv2).
RoCEv2 implica encapsular paquetes de protocolo RDMA dentro de paquetes UDP para el transporte a través de redes Ethernet. El protocolo RoCEv2 utiliza el control de flujo basado en prioridades (PFC) para establecer una red sin caídas, mientras que la notificación de congestión cuantificada del centro de datos (DCQCN) proporciona control de congestión de extremo a extremo para RoCEv2. Junos OS evolucionado admite DCQCN mediante la combinación de la notificación de congestión explícita (ECN) y PFC para habilitar redes Ethernet de IA sin pérdidas de extremo a extremo.
Para admitir tráfico IPv6 sin pérdida a través de conexiones de capa 3 (L3) a subredes de capa 2 (L2), puede configurar PFC para que funcione utilizando valores de punto de código de servicios diferenciados (DSCP) de 6 bits de encabezados L3 de tráfico de VLAN sin etiquetar. Puede usar PFC con DSCP como alternativa a los valores de prioridad IEEE 802.1p en encabezados de paquetes etiquetados con VLAN L2. Necesita PFC basado en DSCP para admitir RoCEv2.
Beneficios-
Utilice redes basadas en Ethernet para redes de centros de datos de IA-ML.
-
Mejore la eficiencia de red para grandes conjuntos de datos.
-
Habilite redes Ethernet de IA-ML sin pérdidas de extremo a extremo.
Configuración
Para configurar PFC basada en DSCP:
Asigne una clase de reenvío sin pérdida a una prioridad PFC (un valor de 3 bits representado en forma decimal (0-7), para utilizarla en las tramas de pausa PFC.
También debe asignar una cola de salida a la clase de reenvío con la
queue-numopción. Enno-losseste caso, la opción es necesaria para admitir el comportamiento sin pérdida para PFC basado en DSCP y lapfc-priorityinstrucción especifica la asignación de valor de prioridad, como se indica a continuación:[edit class-of-service] user@device# set forwarding-classes class class-name queue-num queue-number no-loss user@device# set forwarding-classes class class-name pfc-priority pfc-priority
Defina un perfil de notificación de congestión de entrada para habilitar PFC en el tráfico especificado por el valor DSCP de 6 bits deseado. Configure opcionalmente la unidad de recepción máxima (MRU) y la longitud del cable (se utiliza para determinar el espacio de margen del búfer PFC reservado para el vínculo):
Nota:No puede configurar PFC basado en DSCP y PFC IEEE 802.1p en el mismo perfil de notificación de congestión.
[edit class-of-service] user@device# set congestion-notification-profile name input dscp code-point code-point-bits pfc mru mru-value user@device# set congestion-notification-profile name cable-length cable-length-value
Configure un clasificador DSCP para el valor DSCP configurado y la clase de reenvío sin pérdidas asignados en los pasos anteriores:
[edit class-of-service] user@device# set classifiers dscp classifier-name forwarding-class class-name loss-priority level code-points code-point-bits
Asigne el clasificador y el perfil de notificación de congestión configurados en los pasos anteriores a una interfaz en la que habilite PFC basada en DSCP:
[edit class-of-service] user@device# set interfaces interface-name classifiers dscp classifier-name user@device# set interfaces interface-name congestion-notification-profile profile-name
Revise su configuración.
Por ejemplo, con los siguientes comandos de ejemplo: configurar PFC basado en DSCP para la interfaz xe-0/0/1, se generarán tramas de pausa de PFC con prioridad PFC 3 cuando el tráfico entrante con el valor DSCP 110000 se congestione:
set interfaces xe-0/0/1 unit 0 family inet address 10.1.1.2/24 set class-of-service forwarding-classes class fc1 queue-num 1 no-loss set class-of-service forwarding-classes class fc1 pfc-priority 3 set class-of-service congestion-notification-profile dpfc-cnp input dscp code-point 110000 pfc set class-of-service classifiers dscp dpfc forwarding-class fc1 loss-priority low code-points 110000 set class-of-service interfaces xe-0/0/1 congestion-notification-profile dpfc-cnp set class-of-service interfaces xe-0/0/1 classifiers dscp dpfc
Configuración para enrutadores de la serie PTX10000
Verifique la configuración.
Compruebe el puerto de entrada.
show interfaces interface-name extensive | match Priority
show interfaces queue interface-name
Muestra el perfil de notificación de congestión de entrada basado en DSCP.
show class-of-service congestion-notification-profile cnp name
Muestra qué clases de reenvío se asignan a cada prioridad PFC.
show class-of-service forwarding-classes