Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

PFC basado en DSCP para tráfico de capa 3 sin etiquetar

Puede configurar PFC basado en DSCP para que admita el comportamiento sin pérdida para el tráfico sin etiqueta a través de conexiones de capa 3 a subredes de capa 2 para protocolos como el acceso directo de memoria remota (RDMA) sobre Ethernet convergente versión 2 (RoCEv2).

Descripción general

Con PFC basada en DSCP, las tramas de pausa se generan para notificar al par que el vínculo está congestionado en función de un valor de punto de código de servicios distribuidos (DSCP) de 6 bits configurado en el encabezado IP de capa 3 del tráfico entrante, en lugar de un punto de código IEEE 802.1p de 3 bits en el encabezado de VLAN de capa 2.

Dado que PFC solo puede enviar tramas de pausa correspondientes a puntos de código de prioridad PFC, el valor DSCP configurado de 6 bits debe asignarse a una prioridad PFC de 3 bits para utilizarlo en tramas de pausa cuando se activa PFC basado en DSCP. La configuración de la asignación implica asignar el valor de prioridad PFC a una clase de reenvío sin pérdidas cuando se asigna la clase de reenvío a una cola, definir un perfil de notificación de congestión para habilitar PFC en el tráfico con el valor DSCP deseado y configurar un clasificador DSCP para asociar la clase de reenvío asignada a prioridades PFC (junto con la prioridad de pérdida) con el valor DSCP configurado en el que activar las tramas de pausa PFC.

El dispositivo par debe tener una PFC de salida y una cola de control de flujo correspondiente configurada para que coincida con la configuración de prioridad de PFC en el dispositivo.

Use el Explorador de características para confirmar la compatibilidad de plataforma y versión para características específicas.

PFC basado en DSCP para tráfico de capa 3 sin etiquetar en centros de datos de IA-ML

Las aplicaciones de IA y ML se están expandiendo rápidamente en los centros de datos. Cuando se trata de cargas de trabajo de IA y ML y grandes conjuntos de datos, un desafío crítico es manejar el tamaño de los datos. Descargar la computación a unidades de procesamiento gráfico (GPU) puede acelerar considerablemente esta tarea. Sin embargo, el tamaño de los datos y el modelo, especialmente con modelos de lenguaje grandes (LLM), a menudo superan la capacidad de memoria de una sola GPU. Como resultado, normalmente necesita varias GPU para lograr tiempos razonables de finalización del trabajo, especialmente para la capacitación.

El rendimiento de un centro de datos de IA depende de la cantidad de GPU que se utilicen y de la eficiencia de la red que los conecta. Las ralentizaciones en la red pueden llevar a una subutilización de las GPU y a tiempos de finalización de trabajos más largos. Las redes basadas en Ethernet se están volviendo más populares como una alternativa a InfiniBand para redes de centros de datos de IA. Una solución es la red de acceso directo de memoria remota (RDMA) a través de Ethernet convergente versión 2 (RoCEv2).

RoCEv2 implica encapsular paquetes de protocolo RDMA dentro de paquetes UDP para el transporte a través de redes Ethernet. El protocolo RoCEv2 utiliza el control de flujo basado en prioridades (PFC) para establecer una red sin caídas, mientras que la notificación de congestión cuantificada del centro de datos (DCQCN) proporciona control de congestión de extremo a extremo para RoCEv2. Junos OS evolucionado admite DCQCN mediante la combinación de la notificación de congestión explícita (ECN) y PFC para habilitar redes Ethernet de IA sin pérdidas de extremo a extremo.

Para admitir tráfico IPv6 sin pérdida a través de conexiones de capa 3 (L3) a subredes de capa 2 (L2), puede configurar PFC para que funcione utilizando valores de punto de código de servicios diferenciados (DSCP) de 6 bits de encabezados L3 de tráfico de VLAN sin etiquetar. Puede usar PFC con DSCP como alternativa a los valores de prioridad IEEE 802.1p en encabezados de paquetes etiquetados con VLAN L2. Necesita PFC basado en DSCP para admitir RoCEv2.

Beneficios
  • Utilice redes basadas en Ethernet para redes de centros de datos de IA-ML.

  • Mejore la eficiencia de red para grandes conjuntos de datos.

  • Habilite redes Ethernet de IA-ML sin pérdidas de extremo a extremo.

Configuración

Para configurar PFC basada en DSCP:

  1. Asigne una clase de reenvío sin pérdida a una prioridad PFC (un valor de 3 bits representado en forma decimal (0-7), para utilizarla en las tramas de pausa PFC.

    También debe asignar una cola de salida a la clase de reenvío con la queue-num opción. En no-loss este caso, la opción es necesaria para admitir el comportamiento sin pérdida para PFC basado en DSCP y la pfc-priority instrucción especifica la asignación de valor de prioridad, como se indica a continuación:

  2. Defina un perfil de notificación de congestión de entrada para habilitar PFC en el tráfico especificado por el valor DSCP de 6 bits deseado. Configure opcionalmente la unidad de recepción máxima (MRU) y la longitud del cable (se utiliza para determinar el espacio de margen del búfer PFC reservado para el vínculo):

    Nota:

    No puede configurar PFC basado en DSCP y PFC IEEE 802.1p en el mismo perfil de notificación de congestión.

  3. Configure un clasificador DSCP para el valor DSCP configurado y la clase de reenvío sin pérdidas asignados en los pasos anteriores:

  4. Asigne el clasificador y el perfil de notificación de congestión configurados en los pasos anteriores a una interfaz en la que habilite PFC basada en DSCP:

  5. Revise su configuración.

    Por ejemplo, con los siguientes comandos de ejemplo: configurar PFC basado en DSCP para la interfaz xe-0/0/1, se generarán tramas de pausa de PFC con prioridad PFC 3 cuando el tráfico entrante con el valor DSCP 110000 se congestione:

Configuración para enrutadores de la serie PTX10000

  1. Los enrutadores de la serie PTX10000 tienen espacios de búfer separados para colas con y sin pérdida, con el 10 por ciento del total de espacios de búfer reservados para colas sin pérdida de forma predeterminada. Si es necesario, ajuste la cantidad de espacio de memoria reservado para la cola sin pérdida.
    Puede ajustar el porcentaje de espacio de memoria reservado para las colas sin pérdida por FPC:
  2. Asigne una clase de reenvío sin pérdida a una prioridad PFC (un valor de 3 bits representado en forma decimal (0-7), para utilizarla en las tramas de pausa PFC.

    También debe asignar una cola de salida a la clase de reenvío con la queue-num opción. En no-loss este caso, la opción es necesaria para admitir el comportamiento sin pérdida para PFC basado en DSCP y la pfc-priority instrucción especifica la asignación de valor de prioridad, como se indica a continuación:

  3. Defina un perfil de notificación de congestión de entrada para habilitar PFC en el tráfico especificado por el valor DSCP de 6 bits deseado. Configure opcionalmente la unidad de recepción máxima (MRU) y la longitud del cable (se utiliza para determinar el espacio de margen del búfer PFC reservado para el vínculo):
    Nota:

    No puede configurar PFC basado en DSCP y PFC IEEE 802.1p en el mismo perfil de notificación de congestión.

    Incluya la(s) cuenta(s) PFC y asigne una cuenta PFC a cada punto de código.

  4. Configure un clasificador DSCP para el valor DSCP configurado y la clase de reenvío sin pérdidas asignados en los pasos anteriores:
  5. Asigne el clasificador y el perfil de notificación de congestión configurados en los pasos anteriores a una interfaz en la que habilite PFC basada en DSCP:
  6. Revise su configuración.

    Por ejemplo, con los siguientes comandos de ejemplo que configuran PFC basado en DSCP para la interfaz xe-0/0/1, se generarán tramas de pausa de PFC con prioridad PFC 3 cuando el tráfico entrante con el valor DSCP 110000 alcance un retraso igual a XOFF, que se establece en 5000 microsegundos, y se envíe una trama de reanudación con el retraso vuelve a caer por debajo de XON, que se establece en 2500 microsegundos:

Verifique la configuración.

  1. Compruebe el puerto de entrada.

  2. Muestra el perfil de notificación de congestión de entrada basado en DSCP.

  3. Muestra qué clases de reenvío se asignan a cada prioridad PFC.