Fehlerbehebung bei Fehlerbedingungen
In den folgenden Abschnitten erfahren Sie, wie Sie Probleme am Router mithilfe von Alarmmeldungen und Komponentenanzeigen diagnostizieren können.
Hier erfahren Sie, wo Sie anfangen können
Ihnen stehen Ressourcen zur Fehlerbehebung über Junos OS-Alarmmeldungen und LED-Anzeigen zur Verfügung. Sie können diese Links verwenden, um zu erfahren, was diese Alarme und Anzeigen bedeuten, wenn ein Fehler auftritt.
Zur Fehlerbehebung am Router verwenden Sie die Junos OS CLI, Alarme und LEDs an den Netzwerkports, dem Management Panel des Routing Control Board (RCB) und Komponenten.
-
LEDs: Wenn die Routing-Engine eine Alarmsituation erkennt, leuchtet die rote oder gelbe Alarm-LED auf dem Management Panel auf. Darüber hinaus können Sie Komponenten-LEDs und Netzwerkport-LEDs zur Fehlerbehebung am Router verwenden.
-
CLI: Die CLI ist das primäre Tool für den Datenfluss und die Fehlerbehebung von Hardware, Junos OS, Routing-Protokollen und Netzwerkkonnektivität. CLI-Befehle zeigen Informationen aus Routing-Tabellen, Informationen zu Routing-Protokollen und Informationen zur Netzwerkkonnektivität an, die von den Dienstprogrammen ping und traceroute abgeleitet werden. Hinweise zur Verwendung der CLI zur Fehlerbehebung von Junos OS finden Sie im entsprechenden Junos OS-Konfigurationshandbuch.
-
JTAC—Wenn Sie Hilfe bei der Fehlerbehebung benötigen, können Sie sich über das Internet oder telefonisch an das Juniper Networks Technical Assistance Center (JTAC) wenden. Wenn Sie auf Softwareprobleme oder Probleme mit Hardwarekomponenten stoßen, die hier nicht behandelt werden, wenden Sie sich an JTAC.
-
Knowledge Base-Artikel: Wissensdatenbank.
Übersicht über Alarmmeldungen
Wenn eine Routing-Engine eine Alarmsituation erkennt, leuchtet die rote oder gelbe Alarm-LED auf dem RCB-Management-Panel. Um eine detailliertere Beschreibung der Alarmursache anzuzeigen, geben Sie den CLI-Befehl ein, der show system alarms
Haupt- und Nebenalarme auf dem System angibt.
In diesem Beispiel ist ein Fehler im Lüfterfach in Steckplatz 4 aufgetreten.
user@host> show system alarms 6 alarms currently active Alarm time Class Description 2020-07-21 09:33:09 PDT Minor PSM 0 PSM MCU AC minimum supported firmware version mismatch 2020-07-21 09:33:09 PDT Minor PSM 1 PSM MCU AC minimum supported firmware version mismatch 2020-07-21 09:33:09 PDT Minor PSM 2 PSM MCU AC minimum supported firmware version mismatch 2020-07-21 09:33:08 PDT Major PSM 0 Input2 Failed 2020-07-21 09:33:09 PDT Major PSM 1 Input2 Failed 2020-07-21 09:33:09 PDT Major PSM 2 Input2 Failed
Sie können auch die Variationen des show system errors
Befehls verwenden, um wichtige Informationen über den Fehler zu finden.
-
show system errors active
– Zeigt aktuell aktive Fehler im System an -
show system errors active fpc
: Zeigt aktive Fehler für Linecards an -
show system errors count
– Zeigt systemweite Fehler und den aktuellen Zählerstand an -
show system errors fru detail
– Zeigt detaillierte FRU-spezifische Fehler an. -
show system errors fru detail fpc
: Zeigt Informationen zu erkannten Fehlern basierend auf der FRU an.
Dieses Beispiel zeigt nicht nur die aktuellen Fehler, sondern auch diejenigen, die gelöscht werden.
user@host> show system errors count Level Occurred Cleared Action-Taken ------------------------------------------- Minor 35 32 39 Major 3 0 6 Fatal 0 0 0
Gehäuse-Alarmmeldungen
Gehäusealarme weisen auf einen Ausfall des Geräts oder einer seiner Komponenten hin. Chassis-Alarme sind voreingestellt und können nicht geändert werden.
Gehäusealarme auf dem Router haben zwei Schweregrade:
-
Schwerwiegend (rot): Weist auf eine kritische Situation des Geräts hin, die auf eine der in Tabelle 1 beschriebenen Bedingungen zurückzuführen ist. Ein roter Alarm erfordert sofortiges Handeln.
-
Geringfügig (gelb oder gelb): Weist auf einen unkritischen Zustand des Geräts hin, der, wenn er nicht aktiviert wird, zu einer Unterbrechung des Dienstes oder zu einer Verschlechterung der Leistung führen kann. Ein gelber Alarm muss überwacht oder gewartet werden.
In Tabelle 1 werden die Gehäuse-Alarmmeldungen auf dem Router beschrieben.
Chassis-Komponente |
Alarmbedingung |
Schweregrad des Alarms |
Heilmittel |
---|---|---|---|
Routing-Control Board | Ein RCB ist ausgefallen. |
Major (rot) |
Ersetzen Sie den ausgefallenen RCB. |
Ein RCB wurde entfernt. |
Minor (gelb) |
Installieren Sie einen RCB in dem leeren Steckplatz. |
|
Linecards | Eine Linecard ist offline. |
Minor (gelb) |
Überprüfen Sie die Linecard. Entfernen Sie die Linecard, und installieren Sie sie erneut. Wenn dies fehlschlägt, ersetzen Sie die ausgefallene Karte. |
Eine Linecard ist fehlgeschlagen. |
Major (rot) |
Ersetzen Sie die fehlerhafte Linecard. |
|
Eine Linecard wurde entfernt. |
Major (rot) |
Installieren Sie eine Linecard im leeren Steckplatz. |
|
Lüftereinschübe | Ein Lüfterfach wurde aus dem Gehäuse entfernt. |
Major (rot) |
Setzen Sie das fehlende Lüfterfach ein. |
Ein Lüfter im Gehäuse dreht sich nicht oder unterschreitet die erforderliche Drehzahl. |
Major (rot) |
Setzen Sie das Lüfterfach wieder ein. |
|
Ein Lüfter wird nicht vom Controller für das Lüfterfach mit Strom versorgt. |
Major (rot) |
Überprüfen und ersetzen Sie bei Bedarf den ausgefallenen Lüfterfach-Controller. |
|
Controller für Lüftereinschub | Ein Lüfterfach-Controller ist ausgefallen. |
Minor (gelb) |
Überprüfen und ersetzen Sie bei Bedarf den ausgefallenen Lüfterfach-Controller. |
Einer der Controller für den Lüfterfach im Gehäuse wird nicht mit Strom versorgt. |
Major (rot) |
Prüfen Sie die Stromversorgung. |
|
Switch Interface Boards (SIBs) | Einer der SIBs ist ausgefallen. |
Minor (gelb) |
Überprüfen Sie die folgenden Punkte:
|
Ethernet | Die Ethernet-Managementschnittstelle auf dem RCB ist ausgefallen. |
Minor (gelb) |
|
Austausch im laufenden Betrieb | Es treten zu viele Hot-Swap-Interrupts auf. |
Major (rot) |
Ersetzen Sie die ausgefallenen Komponenten. |
Stromversorgungen | Ein Netzteil wurde aus dem Gehäuse entfernt. |
Minor (gelb) |
Installieren Sie ein Netzteil im leeren Steckplatz. |
Ein Netzteil hat eine hohe Temperatur. |
Major (rot) |
Ersetzen Sie das ausgefallene Netzteil. |
|
Ein Netzteileingang ist ausgefallen. |
Major (rot) |
Prüfen Sie den Netzteileingang und das Netzkabel. |
|
Ein Netzteilausgang ist ausgefallen. |
Major (rot) |
Prüfen Sie den Ausgang des Netzteils. |
|
Eine Stromversorgung ist ausgefallen. |
Major (rot) |
Ersetzen Sie das ausgefallene Netzteil. |
|
AC- und DC-Netzteile sind installiert. |
Major (rot) |
Mischen Sie keine AC- und DC-Netzteile. |
|
Unzureichende Anzahl von Netzteilen. |
Major (rot) |
Installieren Sie ein zusätzliches Netzteil. |
|
Aktueller Freigabeausfall | Major (rot) | Der PSM-Status bleibt während des Ausfalls der aktuellen Freigabe online. Wenn bei Geräten mit Netzteilen der dritten Generation ein Stromfreigabeausfall auftritt, zeigt das System den Fehler nicht auf der LED an und ändert den PSM-Status nicht in Fehler. Stattdessen hält das System den PSM-Status online und löst einen Alarm aus. Es ist keine Aktion erforderlich. |
|
mcu_access_failure |
Major (rot) | Wenn der mcu_access_failure angezeigt wird, aber nicht den Zustand als Fehler anzeigt und das PSM die Ausgangsleistung liefert, deutet dies auf einen Umgebungsfehler des PSM hin. Wenn Sie den PSM-Watchdog aktiviert haben, wird der PSM als Resilienzaktion deaktiviert. |
|
PSM, I2C, SCL-Fehler | Major (rot) | Wenn in einem Gehäuse mit 8 Steckplätzen der SCL-Pin (Serial Clock Line) von I2C aufgrund von Taktdehnung auf dem PSM0 mit dem GND-Pin (Masse) im übergeordneten/primären PSM0 kurzgeschlossen wird, wirkt sich dies auf Transaktionen auf allen untergeordneten/sekundären PSMs aus. Sie können den Status des PSM aufgrund eines "hwdre"-Fehlers nicht sehen. Isolieren Sie in solchen Fällen den fehlerhaften PSM, indem Sie den fehlerhaften PSM iterativ entfernen und identifizieren, und ersetzen Sie den fehlerhaften PSM. Wenn wir die PSMs austauschen und immer noch ein Fehler auf allen PSMs vorhanden ist, ist es möglich, dass ein Fehler im Chassis/in der Midplane vorliegt. Sie können dann dafür eine RMA erstellen. Beispiel: Wenn Sie einen Fehler bei PSM0 und den nachfolgenden PSMs (PSM1 bis PSM3) sehen, liegt der Fehler möglicherweise in PSM0. Sie müssen den PSM0 mit einem anderen PSM desselben primären PSM (PSM1, PSM2 oder PSM3) austauschen und prüfen, ob er behoben ist. Wenn ein Fehler bei PSM4 und den nachfolgenden untergeordneten/sekundären PSMs (PSM5) angezeigt wird, liegt der Fehler möglicherweise in PSM4. Sie müssen PSM4 durch PSM5 ersetzen (da PSM4 das primäre PSM ist) und prüfen, ob es behoben ist.
|
|
Kurzer Stiftausfall | Major (rot) | Durch einen kurzen Pin-Ausfall kann das Netzteil erkennen, ob es richtig mit der Mid-Plane verbunden ist. Wenn dies erkannt wird, schaltet sich das Stromversorgungsmodul (PSM) am Ausgang ein. Da dieses Problem außerhalb des PSM auftritt, wird es nicht als PSM-Fehler betrachtet. Folglich leuchtet die Fehler-LED nicht rot. Versuchen Sie, den Vorgang erneut einzusetzen, und geben Sie den PSM (RMA) zurück, wenn der Fehler weiterhin besteht, da keine Midplane-Konnektivität vorhanden ist. |
|
Einkanaliger PFC-Ausfall | Major (rot) | Wenn auf einem einzelnen Kanal ein PFC-Fehler auftritt, leuchtet die Fehler-LED nicht rot und PSM bleibt im Online-Zustand, da der PSM-Ausgang noch eingeschaltet ist. Wenn jedoch alle vier Kanäle ausfallen, leuchtet die Fehler-LED rot und PSM wird in den Fehlerzustand versetzt. Es ist keine Aktion erforderlich. |
|
Temperatur | Die Gehäusetemperatur hat 40 °C überschritten, die Lüfter wurden auf volle Geschwindigkeit eingeschaltet und ein oder mehrere Lüfter sind ausgefallen. |
Minor (gelb) |
|
Die Gehäusetemperatur hat 65 °C überschritten und die Lüfter wurden auf volle Geschwindigkeit eingestellt. |
Minor (gelb) |
|
|
Die Gehäusetemperatur hat 65 °C überschritten und ein Lüfter ist ausgefallen. Wenn dieser Zustand länger als 90 Sekunden anhält, wird der Router heruntergefahren. |
Major (rot) |
|
|
Die Gehäusetemperatur hat 75 °C überschritten. Wenn dieser Zustand länger als 90 Sekunden anhält, wird der Router heruntergefahren. |
Major (rot) |
|
|
Der Temperatursensor ist ausgefallen. |
Major (rot) |
Eröffnen Sie einen Support-Fall über den Link Case Manager unter https://www.juniper.net/support/ oder rufen Sie 1-888-314-5822 (gebührenfrei, USA und Kanada) oder 1-408-745-9500 (von außerhalb der Vereinigten Staaten) an. |