Comment résoudre les problèmes liés aux conditions d’erreur
Lisez les sections suivantes pour savoir comment diagnostiquer des problèmes sur le routeur à l’aide de messages d’alarme et d’indicateurs de composants.
Par où commencer
Des ressources de dépannage sont disponibles via les messages d’alarme et les voyants LED de Junos OS. Vous pouvez utiliser ces liens pour découvrir ce que signifient ces alarmes et indicateurs lorsqu’une erreur se produit.
Pour dépanner un routeur, vous utilisez la CLI de Junos OS, les alarmes et les voyants sur les ports réseau, le panneau de gestion de la carte de contrôle de routage (RCB) et les composants.
-
LED : lorsque le moteur de routage détecte une condition d’alarme, il allume le voyant d’alarme rouge ou jaune sur le panneau de gestion, selon le cas. Vous pouvez également utiliser des voyants de composants et de ports réseau pour dépanner le routeur.
-
CLI : la CLI est le principal outil utilisé pour fluidifier et dépanner le matériel, Junos OS, les protocoles de routage et la connectivité réseau. Les commandes CLI affichent des informations provenant des tables de routage, des informations spécifiques aux protocoles de routage et des informations sur la connectivité réseau dérivées des utilitaires ping et traceroute. Pour plus d’informations sur l’utilisation de la CLI pour dépanner Junos OS, reportez-vous au guide de configuration de Junos OS approprié.
-
JTAC : si vous avez besoin d’aide pour le dépannage, vous pouvez contacter le Centre d’assistance technique de Juniper Networks (JTAC) via Internet ou par téléphone. Si vous rencontrez des problèmes logiciels ou des problèmes avec des composants matériels non abordés ici, contactez le JTAC.
-
Articles de la base de connaissances : base de connaissances.
Présentation des messages d’alarme
Lorsqu’un moteur de routage détecte une condition d’alarme, il allume le voyant d’alarme rouge ou jaune sur le panneau de gestion RCB, selon le cas. Pour afficher une description plus détaillée de la cause de l’alarme, exécutez la show system alarms commande CLI, qui indique les alarmes majeures et mineures sur le système.
Dans cet exemple, une erreur de tiroir de ventilation s’est produite dans l’emplacement 4.
user@host> show system alarms 6 alarms currently active Alarm time Class Description 2020-07-21 09:33:09 PDT Minor PSM 0 PSM MCU AC minimum supported firmware version mismatch 2020-07-21 09:33:09 PDT Minor PSM 1 PSM MCU AC minimum supported firmware version mismatch 2020-07-21 09:33:09 PDT Minor PSM 2 PSM MCU AC minimum supported firmware version mismatch 2020-07-21 09:33:08 PDT Major PSM 0 Input2 Failed 2020-07-21 09:33:09 PDT Major PSM 1 Input2 Failed 2020-07-21 09:33:09 PDT Major PSM 2 Input2 Failed
Vous pouvez également utiliser les variantes de la show system errors commande pour rechercher des informations clés sur l’erreur.
-
show system errors active: affiche les erreurs actives actuelles dans le système -
show system errors active fpc: affiche les erreurs actives pour les cartes de ligne -
show system errors count: affiche les erreurs à l’échelle du système et le nombre actuel -
show system errors fru detail: affiche des erreurs détaillées spécifiques à la FRU -
show system errors fru detail fpc: affiche des informations sur les erreurs détectées en fonction de la FRU
Cet exemple montre non seulement les erreurs actuelles, mais aussi celles qui sont effacées.
user@host> show system errors count Level Occurred Cleared Action-Taken ------------------------------------------- Minor 35 32 39 Major 3 0 6 Fatal 0 0 0
Messages d’alarme du châssis
Les alarmes de châssis indiquent une défaillance de l’équipement ou de l’un de ses composants. Les alarmes de châssis sont prédéfinies et ne peuvent pas être modifiées.
Les alarmes de châssis sur le routeur ont deux niveaux de sévérité :
-
Majeur (rouge) : indique une situation critique sur l’équipement résultant de l’une des conditions décrites dans le Tableau 1. Une condition d’alarme rouge nécessite une action immédiate.
-
Mineur (jaune ou orange) : indique une condition non critique sur l’appareil qui, si elle n’est pas cochée, peut entraîner une interruption de service ou une dégradation des performances. Une condition d’alarme jaune nécessite une surveillance ou une maintenance.
Le Tableau 1 décrit les messages d’alarme du châssis sur le routeur.
| Composant du châssis |
Condition d’alarme |
Gravité des alarmes |
Recours |
|---|---|---|---|
| Carte de contrôle de routage | Un RCB a échoué. |
Majeure (rouge) |
Remplacez le RCB défaillant. |
| Un RCB a été supprimé. |
Mineure (jaune) |
Installez un RCB dans l’emplacement vide. |
|
| Cartes de ligne | Une carte de ligne est hors ligne. |
Mineure (jaune) |
Vérifiez la carte de ligne. Retirez et réinstallez la carte de ligne. En cas d’échec, remplacez la carte défectueuse. |
| Une carte de ligne a échoué. |
Majeure (rouge) |
Remplacez la carte de ligne défectueuse. |
|
| Une carte de ligne a été retirée. |
Majeure (rouge) |
Installez une carte de ligne dans l’emplacement vide. |
|
| Tiroirs de ventilation | Un tiroir de ventilation a été retiré du châssis. |
Majeure (rouge) |
Installez le tiroir de ventilation manquant. |
| Un ventilateur du châssis ne tourne pas ou tourne en dessous de la vitesse requise. |
Majeure (rouge) |
Remplacez le tiroir de ventilation. |
|
| Un ventilateur n’est pas alimenté par le contrôleur du tiroir de ventilation. |
Majeure (rouge) |
Vérifiez et remplacez le contrôleur de plateau de ventilation défectueux si nécessaire. |
|
| Contrôleur de tiroir de ventilation | Un contrôleur de tiroir de ventilation est tombé en panne. |
Mineure (jaune) |
Vérifiez et remplacez le contrôleur de plateau de ventilation défectueux si nécessaire. |
| L’un des contrôleurs de tiroir de ventilation du châssis ne reçoit pas assez d’énergie. |
Majeure (rouge) |
Vérifiez l’alimentation électrique. |
|
| Cartes d’interface de commutation (SIB) | L’un des SIB a échoué. |
Mineure (jaune) |
Vérifiez les éléments ci-dessous :
|
| Ethernet | L’interface de gestion Ethernet du RCB est en panne. |
Mineure (jaune) |
|
| Échange à chaud | Trop d’interruptions de remplacement à chaud se produisent. |
Majeure (rouge) |
Remplacez les composants défectueux. |
| Blocs d’alimentation | Un bloc d’alimentation a été retiré du châssis. |
Mineure (jaune) |
Installez un bloc d’alimentation dans l’emplacement vide. |
| Une alimentation a une température élevée. |
Majeure (rouge) |
Remplacez l’alimentation électrique défectueuse. |
|
| Une entrée d’alimentation est défaillante. |
Majeure (rouge) |
Vérifiez la connexion de l’entrée du bloc d’alimentation et le cordon d’alimentation. |
|
| Une sortie d’alimentation est défaillante. |
Majeure (rouge) |
Vérifiez la connexion de la sortie du bloc d’alimentation. |
|
| Une alimentation électrique est tombée en panne. |
Majeure (rouge) |
Remplacez l’alimentation électrique défectueuse. |
|
| Des alimentations CA et CC sont installées. |
Majeure (rouge) |
Ne mélangez pas les alimentations CA et CC. |
|
| Nombre insuffisant d’alimentations. |
Majeure (rouge) |
Installez un bloc d’alimentation supplémentaire. |
|
| Échec de l’action actuelle | Majeure (rouge) | L’état PSM reste en ligne pendant l’échec du partage actuel. Lorsqu’une défaillance de partage de courant se produit sur des équipements dotés d’alimentations de troisième génération, le système n’indique pas la défaillance sur le voyant et ne change pas l’état PSM sur Fault. Au lieu de cela, le système maintient l’état PSM en ligne et déclenche une alarme. Aucune action requise. |
|
| mcu_access_failure |
Majeure (rouge) | Si le mcu_access_failure s’affiche mais n’affiche pas l’état sous forme de défaut, et si le PSM fournit la puissance de sortie, cela suggère une défaillance environnementale du PSM. Si vous avez activé le chien de garde PSM, le PSM sera désactivé en tant qu’action de résilience. |
|
| Panne SCL I2C PSM | Majeure (rouge) | Dans un châssis à 8 emplacements, si la broche SCL (Serial Clock Line) de I2C court-circuite la broche GND (Ground) dans le PSM0 parent/primaire en raison de l’étirement de l’horloge sur le PSM0, cela affecte les transactions sur tous les PSM enfants/secondaires. Vous ne pourrez pas voir l’état du PSM en raison d’une défaillance « hwdre ». Dans ce cas, isolez le PSM défectueux en le supprimant et en l’identifiant de manière itérative, puis remplacez-le par le PSM défectueux. Si nous échangeons les PSM et qu’un défaut subsiste sur tous les PSM, il est possible qu’un défaut existe dans le châssis/fond de panier central ; vous pouvez alors créer un RMA pour cela. Exemple : Si vous voyez un défaut au niveau de PSM0 et de ses PSM suivants (PSM1 à PSM3), le défaut peut provenir de PSM0. Vous devez échanger le PSM0 avec tout autre PSM du même primaire (PSM1, PSM2 ou PSM3) et vérifier s’il est rectifié. Si vous voyez un défaut au niveau du PSM4 et de ses PSM enfants/secondaires ultérieurs (PSM5), le défaut peut provenir du PSM4. Vous devez remplacer le PSM4 par le PSM5 (car PSM4 est le PSM principal) et vérifier s’il est rectifié. |
|
| Échec de la broche courte | Majeure (rouge) | Une défaillance de broche courte permet au bloc d’alimentation de détecter s’il est correctement connecté au fond de panier central. En cas de détection, le module d’alimentation (PSM) active la sortie. Comme ce problème se produit en externe au PSM, il n’est pas considéré comme une défaillance du PSM. Par conséquent, la LED de défaut ne devient pas rouge. Essayez de réinsérer et, si l’erreur persiste, renvoyez le PSM (RMA) car il n’y a pas de connectivité midplane. |
|
| Défaillance PFC sur un seul canal | Majeure (rouge) | Si une défaillance du PFC se produit sur un seul canal, le voyant de défaut ne devient pas rouge et le PSM reste en état en ligne car la sortie du PSM est toujours activée. Cependant, si les quatre canaux tombent en panne, le voyant de défaut devient rouge et le PSM passe à l’état de défaut. Aucune action requise. |
|
| Température | La température du châssis a dépassé 104 °F (40 °C), les ventilateurs ont été allumés à pleine vitesse et un ou plusieurs ventilateurs sont tombés en panne. |
Mineure (jaune) |
|
| La température du châssis a dépassé les 65 °C (149 °F) et les ventilateurs ont été allumés à pleine vitesse. |
Mineure (jaune) |
|
|
| La température du châssis a dépassé les 65 °C et un ventilateur est tombé en panne. Si cette condition persiste pendant plus de 90 secondes, le routeur s’arrête. |
Majeure (rouge) |
|
|
| La température du châssis a dépassé les 75 °C. Si cette condition persiste pendant plus de 90 secondes, le routeur s’arrête. |
Majeure (rouge) |
|
|
| Le capteur de température est tombé en panne. |
Majeure (rouge) |
Ouvrez un dossier d’assistance en utilisant le lien Case Manager au https://www.juniper.net/support/ ou appelez le 1-888-314-5822 (sans frais, États-Unis et Canada) ou le 1-408-745-9500 (depuis l’extérieur des États-Unis). |