Comment résoudre les problèmes liés aux conditions d’erreur
Lisez les sections suivantes pour savoir comment diagnostiquer des problèmes sur le routeur à l’aide de messages d’alarme et d’indicateurs de composants.
Voici par où commencer
Des ressources de dépannage sont disponibles via les messages d’alarme et les voyants LED de Junos OS. Vous pouvez utiliser ces liens pour découvrir ce que signifient ces alarmes et indicateurs lorsqu’une erreur se produit.
Pour dépanner un routeur, utilisez la CLI de Junos OS, les alarmes et les voyants sur les ports réseau, le panneau de gestion de la carte de contrôle de routage (RCB) et les composants.
-
LED : lorsque le moteur de routage détecte une condition d’alarme, il allume le voyant d’alarme rouge ou jaune sur le panneau de gestion, selon le cas. Vous pouvez également utiliser les voyants des composants et les voyants des ports réseau pour dépanner le routeur.
-
CLI : la CLI est le principal outil utilisé pour gérer et dépanner le matériel, Junos OS, les protocoles de routage et la connectivité réseau. Les commandes CLI affichent des informations provenant des tables de routage, des informations spécifiques aux protocoles de routage et des informations sur la connectivité réseau dérivées des utilitaires ping et traceroute. Pour plus d’informations sur l’utilisation de la CLI pour dépanner Junos OS, reportez-vous au guide de configuration approprié de Junos OS.
-
JTAC : si vous avez besoin d’aide pour le dépannage, vous pouvez contacter le Centre d’assistance technique de Juniper Networks (JTAC) via le Web ou par téléphone. Si vous rencontrez des problèmes logiciels ou des problèmes avec des composants matériels non abordés ici, contactez le JTAC.
-
Articles de la base de connaissances : base de connaissances.
Vue d’ensemble des messages d’alarme
Lorsqu’un moteur de routage détecte une condition d’alarme, il allume le voyant d’alarme rouge ou jaune sur le panneau de gestion RCB, selon le cas. Pour afficher une description plus détaillée de la cause de l’alarme, exécutez la show system alarms
commande CLI, qui indique les alarmes majeures et mineures sur le système.
Dans cet exemple, une erreur de plateau de ventilation s’est produite dans l’emplacement 4.
user@host> show system alarms 6 alarms currently active Alarm time Class Description 2020-07-21 09:33:09 PDT Minor PSM 0 PSM MCU AC minimum supported firmware version mismatch 2020-07-21 09:33:09 PDT Minor PSM 1 PSM MCU AC minimum supported firmware version mismatch 2020-07-21 09:33:09 PDT Minor PSM 2 PSM MCU AC minimum supported firmware version mismatch 2020-07-21 09:33:08 PDT Major PSM 0 Input2 Failed 2020-07-21 09:33:09 PDT Major PSM 1 Input2 Failed 2020-07-21 09:33:09 PDT Major PSM 2 Input2 Failed
Vous pouvez également utiliser les variantes de la show system errors
commande pour trouver des informations clés sur l’erreur.
-
show system errors active
: affiche les erreurs actives actuelles dans le système -
show system errors active fpc
: affiche les erreurs actives pour les fiches de ligne -
show system errors count
: affiche les erreurs à l’échelle du système et le nombre actuel -
show system errors fru detail
: affiche les erreurs détaillées spécifiques à la FRU -
show system errors fru detail fpc
: affiche des informations sur les erreurs détectées en fonction de la FRU
Cet exemple montre non seulement les erreurs actuelles, mais aussi celles qui sont effacées.
user@host> show system errors count Level Occurred Cleared Action-Taken ------------------------------------------- Minor 35 32 39 Major 3 0 6 Fatal 0 0 0
Messages d’alarme du châssis
Les alarmes de châssis indiquent une défaillance de l’équipement ou de l’un de ses composants. Les alarmes du châssis sont préréglées et ne peuvent pas être modifiées.
Les alarmes de châssis sur le routeur ont deux niveaux de gravité :
-
Majeur (rouge) : indique une situation critique sur l’équipement résultant de l’une des conditions décrites dans le Tableau 1. Une condition d’alarme rouge nécessite une action immédiate.
-
Mineur (jaune ou orange) : indique une condition non critique sur l’équipement qui, si elle n’est pas cochée, peut entraîner une interruption de service ou une dégradation des performances. Une condition d’alarme jaune nécessite une surveillance ou une maintenance.
Le Tableau 1 décrit les messages d’alarme du châssis sur le routeur.
Composant de châssis |
Condition d’alarme |
Gravité de l’alarme |
Remède |
---|---|---|---|
Carte de contrôle de routage | Un RCB a échoué. |
Majeur (rouge) |
Remplacez le disjoncteur différentiel défaillant. |
Une RCB a été supprimée. |
Mineur (jaune) |
Installez un RCB dans l’emplacement vide. |
|
Cartes de ligne | Une carte de ligne est hors ligne. |
Mineur (jaune) |
Vérifiez la carte de ligne. Retirez et réinstallez la carte de ligne. Si cela échoue, remplacez la carte défectueuse. |
Une carte de ligne est défaillante. |
Majeur (rouge) |
Remplacez la carte de ligne défectueuse. |
|
Une carte de ligne a été retirée. |
Majeur (rouge) |
Installez une carte de ligne dans l’emplacement vide. |
|
Plateaux de ventilation | Un plateau de ventilation a été retiré du châssis. |
Majeur (rouge) |
Installez le plateau de ventilation manquant. |
Un ventilateur du châssis ne tourne pas ou tourne en dessous de la vitesse requise. |
Majeur (rouge) |
Remplacez le plateau de ventilation. |
|
Un ventilateur n’est pas alimenté par le contrôleur du plateau de ventilation. |
Majeur (rouge) |
Vérifiez et remplacez le contrôleur de plateau de ventilation défectueux si nécessaire. |
|
Contrôleur de plateau de ventilation | Un contrôleur de plateau de ventilation est défaillant. |
Mineur (jaune) |
Vérifiez et remplacez le contrôleur de plateau de ventilation défectueux si nécessaire. |
L’un des contrôleurs du plateau de ventilation du châssis ne reçoit pas assez d’énergie. |
Majeur (rouge) |
Vérifiez l’alimentation électrique. |
|
Cartes d’interface de commutation (SIB) | L’un des SIB a échoué. |
Mineur (jaune) |
Vérifiez les éléments ci-dessous :
|
Ethernet | L’interface de gestion Ethernet du RCB est en panne. |
Mineur (jaune) |
|
Échange à chaud | Il y a trop d’interruptions de remplacement à chaud. |
Majeur (rouge) |
Remplacez les composants défectueux. |
Alimentations | Un bloc d’alimentation a été débranché du châssis. |
Mineur (jaune) |
Installez un bloc d’alimentation dans l’emplacement vide. |
Une alimentation a une température élevée. |
Majeur (rouge) |
Remplacez le bloc d’alimentation défaillant. |
|
Une entrée d’alimentation est défaillante. |
Majeur (rouge) |
Vérifiez la connexion d’entrée du bloc d’alimentation et le cordon d’alimentation. |
|
Une sortie du bloc d’alimentation est défaillante. |
Majeur (rouge) |
Vérifiez la connexion de la sortie de l’alimentation électrique. |
|
Une panne d’alimentation électrique est tombée. |
Majeur (rouge) |
Remplacez le bloc d’alimentation défaillant. |
|
Des alimentations CA et CC sont installées. |
Majeur (rouge) |
Ne mélangez pas les alimentations CA et CC. |
|
Nombre insuffisant d’alimentations. |
Majeur (rouge) |
Installez un bloc d’alimentation supplémentaire. |
|
Défaillance du partage actuel | Majeur (rouge) | L’état PSM reste en ligne pendant l’échec du partage en cours. Lorsqu’une défaillance du partage de courant se produit sur des appareils dotés d’alimentations de troisième génération, le système n’indique pas la défaillance sur le voyant et ne change pas l’état du PSM en Défaut. Au lieu de cela, le système maintient l’état PSM en ligne et déclenche une alarme. Aucune action n’est requise. |
|
mcu_access_failure |
Majeur (rouge) | Si le mcu_access_failure s’affiche mais n’affiche pas l’état de défaut, et si le PSM fournit la puissance de sortie, cela suggère une défaillance environnementale du PSM. Si vous avez activé le chien de garde PSM, le PSM sera désactivé par mesure de résilience. |
|
Défaillance PSM I2C SCL | Majeur (rouge) | Dans un châssis à 8 emplacements, si la broche SCL (Serial Clock Line) d’I2C court-circuite la broche GND (masse) dans le PSM0 parent/principal en raison de l’étirement de l’horloge sur le PSM0, cela a un impact sur les transactions sur tous les PSM enfants/secondaires. Vous ne pourrez pas voir l’état du PSM en raison de l’échec de « hwdre ». Dans ce cas, isolez le MSP défectueux en supprimant et en identifiant le MSP défectueux de manière itérative, puis remplacez le MSP défectueux. Si nous intervertissons les PSM et qu’il reste des défauts sur tous les PSM, il est possible que des défauts existent dans le châssis/le fond de panier central ; vous pouvez ensuite créer une RMA pour cela. Exemple : si vous constatez une défaillance au niveau de PSM0 et de ses PSM suivants (PSM1 à PSM3), la panne peut provenir de PSM0. Vous devez échanger le PSM0 avec n’importe quel autre PSM du même principal (PSM1, PSM2 ou PSM3) et vérifier s’il est rectifié. Si vous constatez une défaillance au niveau de PSM4 et de ses PSM enfants/secondaires suivants (PSM5), la panne provient peut-être de PSM4. Vous devez remplacer le PSM4 par le PSM5 (car le PSM4 est le PSM principal) et vérifier s’il est rectifié.
|
|
Défaillance de broche courte | Majeur (rouge) | Une défaillance de broche courte permet au bloc d’alimentation de détecter s’il est correctement connecté au fond de panier central. Lorsqu’il est détecté, le module d’alimentation (PSM) active la sortie. Étant donné que ce problème se produit en dehors du PSM, il n’est pas considéré comme un échec PSM. Par conséquent, la LED de défaut ne devient pas rouge. Essayez de réinsérer et, si l’erreur persiste, renvoyez le PSM (RMA) car il n’y a pas de connectivité dans le fond de panier central. |
|
Défaillance pfc à canal unique | Majeur (rouge) | Si une défaillance PFC se produit sur un seul canal, le voyant de défaut ne devient pas rouge et le PSM reste en ligne car la sortie PSM est toujours activée. Cependant, si les quatre canaux tombent en panne, le voyant de défaut devient rouge et PSM passe à l’état de défaut. Aucune action n’est requise. |
|
Température | La température du châssis a dépassé 40 °C, les ventilateurs ont été mis en marche à plein régime et un ou plusieurs ventilateurs sont tombés en panne. |
Mineur (jaune) |
|
La température du châssis a dépassé 65 °C (149 °F) et les ventilateurs ont été mis en marche à plein régime. |
Mineur (jaune) |
|
|
La température du châssis a dépassé 65 °C (149 °F) et un ventilateur est tombé en panne. Si cette condition persiste pendant plus de 90 secondes, le routeur s’arrête. |
Majeur (rouge) |
|
|
La température du châssis a dépassé 75 °C (167 °F). Si cette condition persiste pendant plus de 90 secondes, le routeur s’arrête. |
Majeur (rouge) |
|
|
Le capteur de température est défaillant. |
Majeur (rouge) |
Ouvrez une demande d’assistance en utilisant le lien Gestionnaire de cas à https://www.juniper.net/support/ ou appelez le 1-888-314-5822 (sans frais, États-Unis et Canada) ou le 1-408-745-9500 (de l’extérieur des États-Unis). |