PFC baseado em DSCP para tráfego não marcado de Camada 3
Você pode configurar o PFC baseado em DSCP para suportar comportamento sem perdas para tráfego não marcado em conexões de Camada 3 para sub-redes de Camada 2 para protocolos como Acesso Remoto Direto à Memória (RDMA) sobre Ethernet convergente versão 2 (RoCEv2).
Visão geral
Com o PFC baseado em DSCP, os quadros de pausa são gerados para notificar o peer de que o link está congestionado com base em um valor de ponto de código de Serviços Distribuídos (DSCP) de 6 bits configurado no cabeçalho IP de Camada 3 do tráfego de entrada, em vez de um ponto de código IEEE 802.1p de 3 bits no cabeçalho VLAN de Camada 2.
Como o PFC só pode enviar quadros de pausa correspondentes a pontos de código de prioridade PFC, o valor DSCP configurado de 6 bits deve ser mapeado para uma prioridade PFC de 3 bits a ser usada em quadros de pausa quando o PFC baseado em DSCP for acionado. A configuração do mapeamento envolve o mapeamento do valor de prioridade do PFC para uma classe de encaminhamento sem perda quando você mapeia a classe de encaminhamento para uma fila, definindo um perfil de notificação de congestionamento para habilitar o PFC no tráfego com o valor de DSCP desejado e configurando um classificador de DSCP para associar a classe de encaminhamento mapeada por prioridade de PFC (junto com a prioridade de perda) com o valor de DSCP configurado no qual acionar quadros de pausa de PFC.
O dispositivo peer deve ter PFC de saída e uma fila de controle de fluxo correspondente configurada para corresponder à configuração de prioridade PFC no dispositivo.
Use o Explorador de Recursos para confirmar o suporte à plataforma e à versão para recursos específicos.
PFC baseado em DSCP para tráfego não marcado de Camada 3 em data centers IA-ML
Os aplicativos de IA e ML estão se expandindo rapidamente nos data centers. Ao lidar com cargas de trabalho de IA e ML e grandes conjuntos de dados, um desafio crítico é lidar com o tamanho dos dados. Descarregar a computação para unidades de processamento gráfico (GPUs) pode acelerar significativamente essa tarefa. No entanto, o tamanho dos dados e o modelo, especialmente com LLMs (modelos de linguagem grandes), geralmente excedem a capacidade de memória de uma única GPU. Como resultado, geralmente são necessárias várias GPUs para atingir tempos de conclusão de trabalho razoáveis, especialmente para treinamento.
O desempenho de um data center de IA depende do número de GPUs usadas e da eficiência da rede que as conecta. A lentidão na rede pode levar à subutilização das GPUs e a tempos de conclusão de tarefas mais longos. As redes baseadas em Ethernet estão se tornando mais populares como uma alternativa ao InfiniBand para redes de data center com IA. Uma solução é o Acesso Direto Remoto à Memória (RDMA) sobre Ethernet Convergente versão 2 (RoCEv2).
O RoCEv2 envolve o encapsulamento de pacotes de protocolo RDMA dentro de pacotes UDP para transporte em redes Ethernet. O protocolo RoCEv2 utiliza controle de fluxo baseado em prioridade (PFC) para estabelecer uma rede sem quedas, enquanto a notificação de congestionamento quantificado no data center (DCQCN) fornece controle de congestionamento de ponta a ponta para RoCEv2. O Junos OS Evolved oferece suporte ao DCQCN combinando notificação explícita de congestionamento (ECN) e PFC para permitir redes Ethernet de IA sem perdas de ponta a ponta.
Para oferecer suporte ao tráfego IPv6 sem perdas em conexões de Camada 3 (L3) para sub-redes de Camada 2 (L2), você pode configurar o PFC para operar usando valores de ponto de código de serviços diferenciados (DSCP) de 6 bits de cabeçalhos L3 de tráfego VLAN não marcado. Você pode usar o PFC com DSCP como uma alternativa aos valores de prioridade do IEEE 802.1p em cabeçalhos de pacote marcados com VLAN L2. Você precisa do PFC baseado em DSCP para oferecer suporte ao RoCEv2.
Benefícios-
Utilize redes baseadas em Ethernet para redes de data center com IA-ML.
-
Melhore a eficiência da rede para grandes conjuntos de dados.
-
Habilite redes Ethernet de IA-ML sem perdas de ponta a ponta.
Configuração
Para configurar o PFC baseado em DSCP:
Mapeie uma classe de encaminhamento sem perdas para uma prioridade PFC — um valor de 3 bits representado em forma decimal (0-7) — para usar nos quadros de pausa PFC.
Você também deve atribuir uma fila de saída à classe de encaminhamento com a
queue-numopção. Ano-lossopção é necessária nesse caso para dar suporte ao comportamento sem perdas para PFC baseado em DSCP, e apfc-priorityinstrução especifica o mapeamento de valor de prioridade, da seguinte maneira:[edit class-of-service] user@device# set forwarding-classes class class-name queue-num queue-number no-loss user@device# set forwarding-classes class class-name pfc-priority pfc-priority
Defina um perfil de notificação de congestionamento de entrada para habilitar o PFC no tráfego especificado pelo valor DSCP de 6 bits desejado. Opcionalmente, configure a unidade máxima de recepção (MRU) e o comprimento do cabo (usados para determinar o espaço de espaço livre do buffer PFC reservado para o link):
Observação:Não é possível configurar o PFC baseado em DSCP e o PFC IEEE 802.1p no mesmo perfil de notificação de congestionamento.
[edit class-of-service] user@device# set congestion-notification-profile name input dscp code-point code-point-bits pfc mru mru-value user@device# set congestion-notification-profile name cable-length cable-length-value
Configure um classificador DSCP para o valor de DSCP configurado e a classe de encaminhamento sem perdas mapeada nas etapas anteriores:
[edit class-of-service] user@device# set classifiers dscp classifier-name forwarding-class class-name loss-priority level code-points code-point-bits
Atribua o classificador e o perfil de notificação de congestionamento configurados nas etapas anteriores a uma interface na qual você está habilitando o PFC baseado em DSCP:
[edit class-of-service] user@device# set interfaces interface-name classifiers dscp classifier-name user@device# set interfaces interface-name congestion-notification-profile profile-name
Revise sua configuração.
Por exemplo, com os seguintes comandos de exemplo configurando o PFC baseado em DSCP para a interface xe-0/0/1, os quadros de pausa do PFC serão gerados com prioridade PFC 3 quando o tráfego de entrada com o valor DSCP 110000 ficar congestionado:
set interfaces xe-0/0/1 unit 0 family inet address 10.1.1.2/24 set class-of-service forwarding-classes class fc1 queue-num 1 no-loss set class-of-service forwarding-classes class fc1 pfc-priority 3 set class-of-service congestion-notification-profile dpfc-cnp input dscp code-point 110000 pfc set class-of-service classifiers dscp dpfc forwarding-class fc1 loss-priority low code-points 110000 set class-of-service interfaces xe-0/0/1 congestion-notification-profile dpfc-cnp set class-of-service interfaces xe-0/0/1 classifiers dscp dpfc
Configuração para roteadores da Série PTX10000
Verifique a configuração.
Verifique a porta de entrada.
show interfaces interface-name extensive | match Priority
show interfaces queue interface-name
Exiba o perfil de notificação de congestionamento de entrada baseado em DSCP.
show class-of-service congestion-notification-profile cnp name
Exibir quais classes de encaminhamento são mapeadas para cada prioridade PFC.
show class-of-service forwarding-classes