Como solucionar problemas PTX10004 condições de erro
Leia as seções a seguir para saber como diagnosticar problemas na PTX10004 usando mensagens de alarme e indicadores de componentes.
Veja por onde começar
Você tem recursos de solução de problemas disponíveis por meio de mensagens de alarme do Junos OS e indicadores de LED. Você pode usar esses links para descobrir o que esses alarmes e indicadores significam quando ocorre um erro.
Para solucionar problemas de um chassi modular PTX10004, você usa o Junos OS CLI, alarmes e LEDs nas portas de rede, painel de gerenciamento da Placa de Controle de Roteamento (RCB) e componentes.
LEDs — Quando o mecanismo de roteamento detecta uma condição de alarme, ele acende o LED de alarme vermelho ou amarelo no painel de gerenciamento, conforme apropriado. Além disso, você pode usar LEDs componentes e LEDs de porta de rede para solucionar problemas da PTX10004. Para obter mais informações, veja os seguintes tópicos:
CLI — A CLI é a principal ferramenta usada para fluir e solucionar problemas de hardware, Junos OS, protocolos de roteamento e conectividade de rede. Os comandos CLI exibem informações das tabelas de roteamento, informações específicas para protocolos de roteamento e informações sobre a conectividade de rede derivada das concessionárias de ping e traceroute. Para obter informações sobre o uso da CLI para solucionar problemas do Junos OS, consulte o guia de configuração apropriado do Junos OS.
JTAC — Se você precisar de ajuda durante a solução de problemas, pode entrar em contato com o Centro de Assistência Técnica (JTAC) da Juniper Networks usando a Web ou por telefone. Se você encontrar problemas de software ou problemas com componentes de hardware não discutidos aqui, entre em contato com a JTAC.
Artigos da Base de conhecimento — Base de conhecimento.
Visão geral das mensagens de alarme PTX10004
Quando um mecanismo de roteamento PTX10004 detecta uma condição de alarme, ele acende o LED de alarme vermelho ou amarelo no painel de gerenciamento da RCB, conforme apropriado. Para ver uma descrição mais detalhada da causa do alarme, emita o show system alarms
comando CLI, que indica alarmes maiores e menores no sistema.
Neste exemplo, ocorreu um erro na bandeja do ventilador no slot 4.
user@host> show system alarms 6 alarms currently active Alarm time Class Description 2020-07-21 09:33:09 PDT Minor PSM 0 PSM MCU AC minimum supported firmware version mismatch 2020-07-21 09:33:09 PDT Minor PSM 1 PSM MCU AC minimum supported firmware version mismatch 2020-07-21 09:33:09 PDT Minor PSM 2 PSM MCU AC minimum supported firmware version mismatch 2020-07-21 09:33:08 PDT Major PSM 0 Input2 Failed 2020-07-21 09:33:09 PDT Major PSM 1 Input2 Failed 2020-07-21 09:33:09 PDT Major PSM 2 Input2 Failed
Você também pode usar as variações do show system errors
comando para encontrar informações-chave sobre o erro.
show system errors active
— exibe erros ativos atuais no sistemashow system errors active fpc
— exibe erros ativos para placas de linhashow system errors count
— exibe erros em todo o sistema e a contagem de correnteshow system errors fru detail
— Exibe um erro detalhado específico da FRUshow system errors fru detail fpc
— exibe informações sobre erros detectados com base na FRU
Este exemplo mostra não apenas os erros atuais, mas também aqueles que estão limpos.
user@host> show system errors count Level Occurred Cleared Action-Taken ------------------------------------------- Minor 35 32 39 Major 3 0 6 Fatal 0 0 0
Mensagens de alarme do chassi PTX10004
Os alarmes do chassi indicam uma falha do dispositivo ou de um de seus componentes. Os alarmes do chassi estão predefinidos e não podem ser modificados.
Os alarmes do chassi em PTX1004 chassi modular têm dois níveis de gravidade:
Importante (vermelho)— indica uma situação crítica no dispositivo que resultou de uma das condições descritas na Tabela 1. Uma condição de alarme vermelho requer ação imediata.
Menor (amarelo ou âmbar)— indica uma condição não crítica no dispositivo que, se não for controlada, pode causar uma interrupção no serviço ou degradação no desempenho. Uma condição de alarme amarelo requer monitoramento ou manutenção.
A Tabela 1 descreve as mensagens de alarme do chassi em um roteador PTX10004.
Componente do chassi |
Condição do alarme |
Gravidade do alarme |
Remédio |
---|---|---|---|
Placa de controle de roteamento | Um RCB falhou. |
Major (vermelho) |
Substitua a RCB com falha. |
Um RCB foi removido. |
Menor (amarelo) |
Instale um RCB no slot vazio. |
|
Placas de linha | Uma placa de linha está offline. |
Menor (amarelo) |
Verifique a placa de linha. Remova e reinstale a placa de linha. Se isso falhar, substitua a placa com falha. |
Uma placa de linha falhou. |
Major (vermelho) |
Substitua a placa de linha com falha. |
|
Uma placa de linha foi removida. |
Major (vermelho) |
Instale uma placa de linha no slot vazio. |
|
Bandejas de ventilador | Uma bandeja de ventilador foi removida do chassi. |
Major (vermelho) |
Instale a bandeja de ventilador faltando. |
Um ventilador no chassi não está girando ou está girando abaixo da velocidade necessária. |
Major (vermelho) |
Substitua a bandeja do ventilador. |
|
Um ventilador não está recebendo energia do controlador de bandeja do ventilador. |
Major (vermelho) |
Verifique e substitua o controlador de bandeja de ventoinha com falha, se necessário. |
|
Controlador de bandeja de ventilador | Um controlador de bandeja de ventoinha falhou. |
Menor (amarelo) |
Verifique e substitua o controlador de bandeja de ventoinha com falha, se necessário. |
Um dos controladores de bandeja de ventilador no chassi não está recebendo energia suficiente. |
Major (vermelho) |
Verifique a fonte de alimentação. |
|
Placas de interface de switch (SIBs) | Uma das SIBs falhou. |
Menor (amarelo) |
Confira abaixo:
|
Ethernet | A interface de gerenciamento de Ethernet no RCB está baixa. |
Menor (amarelo) |
|
Troca a quente | Muitas interrupções de hot-swap estão ocorrendo. |
Major (vermelho) |
Substitua os componentes com falha. |
Fontes de alimentação | Uma fonte de alimentação foi removida do chassi. |
Menor (amarelo) |
Instale uma fonte de alimentação no slot vazio. |
Uma fonte de alimentação tem alta temperatura. |
Major (vermelho) |
Substitua a fonte de alimentação com falha. |
|
Uma entrada de fonte de alimentação falhou. |
Major (vermelho) |
Verifique a conexão da entrada de fonte de alimentação e o cabo de alimentação. |
|
Uma saída de fonte de alimentação falhou. |
Major (vermelho) |
Verifique a conexão de saída de fonte de alimentação. |
|
Uma fonte de alimentação falhou. |
Major (vermelho) |
Substitua a fonte de alimentação com falha. |
|
As fontes de alimentação AC e DC estão instaladas. |
Major (vermelho) |
Não misture as fontes de alimentação AC e DC. |
|
Número inadequado de fontes de alimentação. |
Major (vermelho) |
Instale uma fonte de alimentação adicional. |
|
Falha de compartilhamento atual | Major (vermelho) | O estado do PSM permanece on-line durante a falha atual das compartilhamentos. Quando uma falha de compartilhamento atual ocorre em dispositivos com fontes de alimentação de terceira geração, o sistema não indica a falha no LED ou altera o estado do PSM para Falha. Em vez disso, o sistema mantém o estado PSM on-line e levanta um alarme. Nenhuma ação é necessária. |
|
mcu_access_failure |
Major (vermelho) | Se o mcu_access_failure for exibido, mas não mostrar o estado como falha, e se o PSM estiver fornecendo a energia de saída, ele sugere uma falha ambiental do PSM. Se você tiver habilitado o cão de guarda PSM, então, como uma ação de resiliência, o PSM será desativado. |
|
Falha na SCL PSM I2C | Major (vermelho) | Em um chassi de 4 slots, se o pino SCL (Serial Clock Line) de shorts I2C para GND (Ground) pino no PSM0 pai/primário devido ao alongamento do relógio no PSM0, ele afeta as transações em todos os PSMs infantis/secundários. Você não poderá ver o status do PSM devido a uma falha "hwdre". Nesses casos, isole o PSM defeituoso removendo e identificando o PSM defeituoso de forma iterativa e substitua o PSM defeituoso. Se trocarmos os PSMs e permanecermos com falhas em todos os PSMs, é possível que a falha possa existir no chassi/midplane; você pode então criar um RMA para isso. Exemplo: se você estiver vendo falhas no PSM0 e seus PSMs subsequentes (PSM1 a PSM2), a falha pode estar no PSM0. Você deve trocar o PSM0 com qualquer outro PSM a partir do mesmo primário (PSM1 ou PSM2) e verificar se ele é corrigido. |
|
Falha em pinos curtos | Major (vermelho) | Uma falha de pino curto permite que a fonte de alimentação detecte se ela está devidamente conectada ao plano médio. Quando detectado, o módulo de fonte de alimentação (PSM) ativa a saída. Como esse problema ocorre externo ao PSM, ele não é considerado uma falha de PSM. Consequentemente, o LED de falha não é vermelho. Tente reinserir e, se o erro persistir, devolva o PSM (RMA), pois não há conectividade midplane. |
|
Falha de pfc de canal único | Major (vermelho) | Se uma falha de PFC acontecer em um único canal, o LED de falha não ficará vermelho e o PSM permanecerá no estado on-line, pois a saída PSM ainda está ativa. No entanto, se todos os quatro canais falharem, o LED de falha ficará vermelho e o PSM será movido para estado de falha. Nenhuma ação é necessária. |
|
Temperatura | A temperatura do chassi ultrapassou 40° C, os ventiladores foram ligados em velocidade máxima e um ou mais ventiladores falharam. |
Menor (amarelo) |
|
A temperatura do chassi ultrapassou 149° F (65° C), e os ventiladores foram ligados a toda a velocidade. |
Menor (amarelo) |
|
|
A temperatura do chassi ultrapassou 149° F (65° C), e um ventilador falhou. Se essa condição persistir por mais de 90 segundos, o roteador será desativado. |
Major (vermelho) |
|
|
A temperatura do chassi ultrapassou 167° F (75° C). Se essa condição persistir por mais de 90 segundos, o roteador será desativado. |
Major (vermelho) |
|
|
O sensor de temperatura falhou. |
Major (vermelho) |
Abra um caso de suporte usando o link de Gerente de caso em https://www.juniper.net/support/ ou ligue para 1-888-314-5822 (gratuitamente, EUA e Canadá) ou 1-408-745-9500 (de fora dos Estados Unidos). |