AUF DIESER SEITE
Fehlerbehebung bei Fehlerzuständen
In den folgenden Abschnitten erfahren Sie, wie Sie Probleme am Router mithilfe von Alarmmeldungen und Anzeigen für Komponenten diagnostizieren können.
Hier können Sie anfangen
Über die Alarmmeldungen und LED-Anzeigen von Junos OS stehen Ihnen Ressourcen zur Fehlerbehebung zur Verfügung. Über diese Links können Sie herausfinden, was diese Alarme und Anzeigen bedeuten, wenn ein Fehler auftritt.
Zur Fehlerbehebung am Router verwenden Sie die Junos OS CLI, Alarme und LEDs an den Netzwerkports, das Management-Panel des Routing Control Board (RCB) und Komponenten.
-
LEDs: Wenn die Routing-Engine einen Alarmzustand erkennt, leuchtet die rote oder gelbe Alarm-LED auf dem Management-Panel entsprechend auf. Darüber hinaus können Sie Komponenten-LEDs und Netzwerkport-LEDs verwenden, um Fehler im Router zu beheben.
-
CLI: Die CLI ist das primäre Tool für den Datenfluss und die Fehlerbehebung bei Hardware, Junos OS, Routing-Protokollen und Netzwerkkonnektivität. CLI-Befehle zeigen Informationen aus Routing-Tabellen, Informationen zu Routing-Protokollen und Informationen zur Netzwerkkonnektivität an, die von den Dienstprogrammen ping und traceroute abgeleitet werden. Informationen zur Verwendung der CLI zur Fehlerbehebung bei Junos OS finden Sie im entsprechenden Konfigurationshandbuch für Junos OS.
-
JTAC: Wenn Sie bei der Fehlerbehebung Hilfe benötigen, können Sie sich über die Website oder telefonisch an das Technical Assistance Center (JTAC) von Juniper Networks wenden. Wenn Sie auf Softwareprobleme oder Probleme mit Hardwarekomponenten stoßen, die hier nicht behandelt werden, wenden Sie sich an das JTAC.
-
Wissensdatenbank-Artikel – Wissensdatenbank.
Übersicht über Alarmmeldungen
Wenn eine Routing-Engine einen Alarmzustand erkennt, leuchtet die rote oder gelbe Alarm-LED auf dem RCB-Verwaltungspanel entsprechend auf. Um eine detailliertere Beschreibung der Alarmursache anzuzeigen, geben Sie den Befehl CLI ein, der show system alarms größere und kleinere Alarme im System anzeigt.
In diesem Beispiel ist ein Lüftereinschubfehler in Steckplatz 4 aufgetreten.
user@host> show system alarms 6 alarms currently active Alarm time Class Description 2020-07-21 09:33:09 PDT Minor PSM 0 PSM MCU AC minimum supported firmware version mismatch 2020-07-21 09:33:09 PDT Minor PSM 1 PSM MCU AC minimum supported firmware version mismatch 2020-07-21 09:33:09 PDT Minor PSM 2 PSM MCU AC minimum supported firmware version mismatch 2020-07-21 09:33:08 PDT Major PSM 0 Input2 Failed 2020-07-21 09:33:09 PDT Major PSM 1 Input2 Failed 2020-07-21 09:33:09 PDT Major PSM 2 Input2 Failed
Sie können auch die Variationen des show system errors Befehls verwenden, um wichtige Informationen zum Fehler zu finden.
-
show system errors active– Zeigt die aktuell aktiven Fehler im System an -
show system errors active fpc– Zeigt aktive Fehler für Linecards an -
show system errors count– Zeigt systemweite Fehler und die aktuelle Anzahl an -
show system errors fru detail– Zeigt detaillierte FRU-spezifische Fehler an -
show system errors fru detail fpc– Zeigt Informationen über erkannte Fehler basierend auf der FRU an
Dieses Beispiel zeigt nicht nur die aktuellen Fehler, sondern auch die, die gelöscht werden.
user@host> show system errors count Level Occurred Cleared Action-Taken ------------------------------------------- Minor 35 32 39 Major 3 0 6 Fatal 0 0 0
Chassis-Alarmmeldungen
Gehäusealarme weisen auf einen Ausfall des Geräts oder einer seiner Komponenten hin. Chassis-Alarme sind voreingestellt und können nicht geändert werden.
Gehäusealarme auf dem Router haben zwei Schweregrade:
-
Major (rot): Weist auf eine kritische Situation auf dem Gerät hin, die auf eine der in Tabelle 1 beschriebenen Bedingungen zurückzuführen ist. Ein roter Alarm erfordert sofortiges Handeln.
-
Geringfügig (gelb oder gelb): Weist auf einen unkritischen Zustand des Geräts hin, der, wenn er nicht aktiviert wird, zu einer Unterbrechung des Dienstes oder zu einer Verringerung der Leistung führen kann. Ein gelber Alarmzustand erfordert Überwachung oder Wartung.
In Tabelle 1 werden die Gehäuse-Alarmmeldungen auf dem Router beschrieben.
| Chassis-Komponente |
Alarm-Zustand |
Schweregrad des Alarms |
Abhilfe |
|---|---|---|---|
| Routing Control Board | Ein RCB ist ausgefallen. |
Major (rot) |
Ersetzen Sie den ausgefallenen RCB. |
| Ein RCB wurde entfernt. |
Minor (gelb) |
Installieren Sie einen RCB im leeren Steckplatz. |
|
| Linecards | Eine Linecard ist offline. |
Minor (gelb) |
Überprüfen Sie die Linecard. Entfernen Sie die Linecard, und installieren Sie sie erneut. Wenn dies fehlschlägt, ersetzen Sie die ausgefallene Karte. |
| Eine Linecard ist ausgefallen. |
Major (rot) |
Ersetzen Sie die ausgefallene Linecard. |
|
| Eine Linecard wurde entfernt. |
Major (rot) |
Setzen Sie eine Linecard in den leeren Steckplatz ein. |
|
| Lüftereinschübe | Ein Lüftereinschub wurde aus dem Gehäuse entfernt. |
Major (rot) |
Installieren Sie den fehlenden Lüftereinschub. |
| Ein Lüfter im Gehäuse dreht sich nicht oder unter der erforderlichen Geschwindigkeit. |
Major (rot) |
Ersetzen Sie den Lüftereinschub. |
|
| Ein Lüfter wird nicht vom Lüftereinschub-Controller mit Strom versorgt. |
Major (rot) |
Überprüfen und ersetzen Sie bei Bedarf den ausgefallenen Lüftereinschub-Controller. |
|
| Lüftereinschub-Controller | Ein Lüftereinschub-Controller ist ausgefallen. |
Minor (gelb) |
Überprüfen und ersetzen Sie bei Bedarf den ausgefallenen Lüftereinschub-Controller. |
| Einer der Lüftereinschub-Controller im Gehäuse erhält nicht genügend Strom. |
Major (rot) |
Überprüfen Sie die Stromversorgung. |
|
| Switch Interface Boards (SIBs) | Eines der SIBs ist ausgefallen. |
Minor (gelb) |
Überprüfen Sie Folgendes:
|
| Ethernet (Ethernet) | Die Ethernet-Managementschnittstelle des RCB ist ausgefallen. |
Minor (gelb) |
|
| Austausch im laufenden Betrieb | Es treten zu viele Hot-Swap-Interrupts auf. |
Major (rot) |
Ersetzen Sie die ausgefallenen Komponenten. |
| Netzteile | Ein Netzteil wurde aus dem Gehäuse entfernt. |
Minor (gelb) |
Installieren Sie ein Netzteil im leeren Steckplatz. |
| Ein Netzteil hat eine hohe Temperatur. |
Major (rot) |
Ersetzen Sie das ausgefallene Netzteil. |
|
| Ein Netzteileingang ist ausgefallen. |
Major (rot) |
Überprüfen Sie den Anschluss des Netzteileingangs und das Netzkabel. |
|
| Ein Netzteilausgang ist ausgefallen. |
Major (rot) |
Überprüfen Sie die Ausgangsverbindung der Stromversorgung. |
|
| Ein Netzteil ist ausgefallen. |
Major (rot) |
Ersetzen Sie das ausgefallene Netzteil. |
|
| AC- und DC-Netzteile sind installiert. |
Major (rot) |
Mischen Sie keine Wechsel- und Gleichstromnetzteile. |
|
| Unzureichende Anzahl von Netzteilen. |
Major (rot) |
Installieren Sie ein zusätzliches Netzteil. |
|
| Aktueller Freigabeausfall | Major (rot) | Der PSM-Status bleibt während des aktuellen Freigabefehlers online. Wenn auf Geräten mit Netzteilen der dritten Generation ein Stromfreigabefehler auftritt, zeigt das System den Fehler nicht auf der LED an und ändert den PSM-Status nicht in Fehler. Stattdessen hält das System den PSM-Status online und löst einen Alarm aus. Es ist keine Aktion erforderlich. |
|
| mcu_access_failure |
Major (rot) | Wenn die mcu_access_failure angezeigt wird, aber nicht den Status als Fehler anzeigt und das PSM die Ausgangsleistung liefert, deutet dies auf einen Umgebungsausfall des PSM hin. Wenn Sie den PSM-Watchdog aktiviert haben, wird der PSM als Ausfallsicherheitsaktion deaktiviert. |
|
| PSM I2C SCL-Fehler | Major (rot) | Wenn in einem Gehäuse mit 8 Steckplätzen der SCL-Pin (Serial Clock Line) von I2C aufgrund einer Taktverlängerung auf dem übergeordneten/primären PSM0 einen Kurzschluss zum GND-Pin (Masse) im übergeordneten/primären PSM0 aufweist, wirkt sich dies auf Transaktionen auf allen untergeordneten/sekundären PSMs aus. Sie können den Status des PSM aufgrund eines "hwdre"-Fehlers nicht sehen. Isolieren Sie in solchen Fällen das fehlerhafte PSM, indem Sie das fehlerhafte PSM iterativ entfernen und identifizieren, und ersetzen Sie das fehlerhafte PSM. Wenn wir die PSMs austauschen und immer noch ein Fehler auf allen PSMs verbleibt, ist es möglich, dass ein Fehler im Gehäuse / in der Mittelebene vorliegt. Sie können dann dafür eine RMA erheben. Beispiel: Wenn ein Fehler bei PSM0 und den nachfolgenden PSMs (PSM1 bis PSM3) auftritt, liegt der Fehler möglicherweise in PSM0. Sie müssen das PSM0 mit einem anderen PSM desselben Primärnetzwerks (PSM1, PSM2 oder PSM3) austauschen und prüfen, ob es behoben ist. Wenn Sie einen Fehler bei PSM4 und den nachfolgenden untergeordneten/sekundären PSMs (PSM5) sehen, kann der Fehler bei PSM4 liegen. Sie müssen das PSM4 mit PSM5 austauschen (da PSM4 das primäre PSM ist) und prüfen, ob es behoben ist. |
|
| Versagen des kurzen Stifts | Major (rot) | Durch einen kurzen Pinausfall kann das Netzteil erkennen, ob es richtig mit der Mittelebene verbunden ist. Wenn das Netzteilmodul (PSM) erkannt wird, schaltet es den Ausgang ein. Da dieses Problem außerhalb des PSM auftritt, wird es nicht als PSM-Fehler betrachtet. Folglich leuchtet die Fehler-LED nicht rot. Versuchen Sie, das Gerät erneut einzufügen, und geben Sie das PSM (RMA) zurück, wenn der Fehler weiterhin besteht, da keine Midplane-Konnektivität vorhanden ist. |
|
| Einkanal-PFC-Ausfall | Major (rot) | Wenn auf einem einzelnen Kanal ein PFC-Fehler auftritt, leuchtet die Fehler-LED nicht rot und PSM bleibt im Online-Zustand, da der PSM-Ausgang noch eingeschaltet ist. Wenn jedoch alle vier Kanäle ausfallen, leuchtet die Fehler-LED rot und PSM wird in den Fehlerzustand versetzt. Es ist keine Aktion erforderlich. |
|
| Temperatur | Die Gehäusetemperatur hat 40 °C überschritten, die Lüfter wurden auf volle Geschwindigkeit eingeschaltet und ein oder mehrere Lüfter sind ausgefallen. |
Minor (gelb) |
|
| Die Gehäusetemperatur hat 65 °C überschritten, und die Lüfter wurden auf volle Drehzahl geschaltet. |
Minor (gelb) |
|
|
| Die Gehäusetemperatur hat 65 °C überschritten, und ein Lüfter ist ausgefallen. Wenn dieser Zustand länger als 90 Sekunden anhält, wird der Router heruntergefahren. |
Major (rot) |
|
|
| Die Gehäusetemperatur hat 75 °C (167 °F) überschritten. Wenn dieser Zustand länger als 90 Sekunden anhält, wird der Router heruntergefahren. |
Major (rot) |
|
|
| Der Temperatursensor ist ausgefallen. |
Major (rot) |
Eröffnen Sie einen Support-Fall über den Case Manager-Link unter https://www.juniper.net/support/ oder rufen Sie 1-888-314-5822 (gebührenfrei, USA und Kanada) oder 1-408-745-9500 (von außerhalb der USA) an. |