Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

Fehlerbehebung bei Fehlerzuständen

In den folgenden Abschnitten erfahren Sie, wie Sie Probleme am Router mithilfe von Alarmmeldungen und Anzeigen für Komponenten diagnostizieren können.

Hier können Sie anfangen

Über die Alarmmeldungen und LED-Anzeigen von Junos OS stehen Ihnen Ressourcen zur Fehlerbehebung zur Verfügung. Über diese Links können Sie herausfinden, was diese Alarme und Anzeigen bedeuten, wenn ein Fehler auftritt.

Zur Fehlerbehebung am Router verwenden Sie die Junos OS CLI, Alarme und LEDs an den Netzwerkports, das Management-Panel des Routing Control Board (RCB) und Komponenten.

  • LEDs: Wenn die Routing-Engine einen Alarmzustand erkennt, leuchtet die rote oder gelbe Alarm-LED auf dem Management-Panel entsprechend auf. Darüber hinaus können Sie Komponenten-LEDs und Netzwerkport-LEDs verwenden, um Fehler im Router zu beheben.

  • CLI: Die CLI ist das primäre Tool für den Datenfluss und die Fehlerbehebung bei Hardware, Junos OS, Routing-Protokollen und Netzwerkkonnektivität. CLI-Befehle zeigen Informationen aus Routing-Tabellen, Informationen zu Routing-Protokollen und Informationen zur Netzwerkkonnektivität an, die von den Dienstprogrammen ping und traceroute abgeleitet werden. Informationen zur Verwendung der CLI zur Fehlerbehebung bei Junos OS finden Sie im entsprechenden Konfigurationshandbuch für Junos OS.

  • JTAC: Wenn Sie bei der Fehlerbehebung Hilfe benötigen, können Sie sich über die Website oder telefonisch an das Technical Assistance Center (JTAC) von Juniper Networks wenden. Wenn Sie auf Softwareprobleme oder Probleme mit Hardwarekomponenten stoßen, die hier nicht behandelt werden, wenden Sie sich an das JTAC.

  • Wissensdatenbank-Artikel – Wissensdatenbank.

Übersicht über Alarmmeldungen

Wenn eine Routing-Engine einen Alarmzustand erkennt, leuchtet die rote oder gelbe Alarm-LED auf dem RCB-Verwaltungspanel entsprechend auf. Um eine detailliertere Beschreibung der Alarmursache anzuzeigen, geben Sie den Befehl CLI ein, der show system alarms größere und kleinere Alarme im System anzeigt.

In diesem Beispiel ist ein Lüftereinschubfehler in Steckplatz 4 aufgetreten.

Sie können auch die Variationen des show system errors Befehls verwenden, um wichtige Informationen zum Fehler zu finden.

  • show system errors active– Zeigt die aktuell aktiven Fehler im System an

  • show system errors active fpc– Zeigt aktive Fehler für Linecards an

  • show system errors count– Zeigt systemweite Fehler und die aktuelle Anzahl an

  • show system errors fru detail– Zeigt detaillierte FRU-spezifische Fehler an

  • show system errors fru detail fpc– Zeigt Informationen über erkannte Fehler basierend auf der FRU an

Dieses Beispiel zeigt nicht nur die aktuellen Fehler, sondern auch die, die gelöscht werden.

Chassis-Alarmmeldungen

Gehäusealarme weisen auf einen Ausfall des Geräts oder einer seiner Komponenten hin. Chassis-Alarme sind voreingestellt und können nicht geändert werden.

Gehäusealarme auf dem Router haben zwei Schweregrade:

  • Major (rot): Weist auf eine kritische Situation auf dem Gerät hin, die auf eine der in Tabelle 1 beschriebenen Bedingungen zurückzuführen ist. Ein roter Alarm erfordert sofortiges Handeln.

  • Geringfügig (gelb oder gelb): Weist auf einen unkritischen Zustand des Geräts hin, der, wenn er nicht aktiviert wird, zu einer Unterbrechung des Dienstes oder zu einer Verringerung der Leistung führen kann. Ein gelber Alarmzustand erfordert Überwachung oder Wartung.

In Tabelle 1 werden die Gehäuse-Alarmmeldungen auf dem Router beschrieben.

Tabelle 1: Alarmzustände bei Chassis-Komponenten

Chassis-Komponente

Alarm-Zustand

Schweregrad des Alarms

Abhilfe

Routing Control Board

Ein RCB ist ausgefallen.

Major (rot)

Ersetzen Sie den ausgefallenen RCB.

Ein RCB wurde entfernt.

Minor (gelb)

Installieren Sie einen RCB im leeren Steckplatz.

Linecards

Eine Linecard ist offline.

Minor (gelb)

Überprüfen Sie die Linecard. Entfernen Sie die Linecard, und installieren Sie sie erneut. Wenn dies fehlschlägt, ersetzen Sie die ausgefallene Karte.

Eine Linecard ist ausgefallen.

Major (rot)

Ersetzen Sie die ausgefallene Linecard.

Eine Linecard wurde entfernt.

Major (rot)

Setzen Sie eine Linecard in den leeren Steckplatz ein.

Lüftereinschübe

Ein Lüftereinschub wurde aus dem Gehäuse entfernt.

Major (rot)

Installieren Sie den fehlenden Lüftereinschub.

Ein Lüfter im Gehäuse dreht sich nicht oder unter der erforderlichen Geschwindigkeit.

Major (rot)

Ersetzen Sie den Lüftereinschub.

Ein Lüfter wird nicht vom Lüftereinschub-Controller mit Strom versorgt.

Major (rot)

Überprüfen und ersetzen Sie bei Bedarf den ausgefallenen Lüftereinschub-Controller.

Lüftereinschub-Controller

Ein Lüftereinschub-Controller ist ausgefallen.

Minor (gelb)

Überprüfen und ersetzen Sie bei Bedarf den ausgefallenen Lüftereinschub-Controller.

Einer der Lüftereinschub-Controller im Gehäuse erhält nicht genügend Strom.

Major (rot)

Überprüfen Sie die Stromversorgung.

Switch Interface Boards (SIBs)

Eines der SIBs ist ausgefallen.

Minor (gelb)

Überprüfen Sie Folgendes:

  • Das SIB erhält keinen Strom.

  • Der Lüftereinschub-Controller hat ein Stromproblem.

Ethernet (Ethernet)

Die Ethernet-Managementschnittstelle des RCB ist ausgefallen.

Minor (gelb)

  • Überprüfen Sie die Verbindung des Schnittstellenkabels.

  • Starten Sie das System neu.

  • Wenn der Alarm erneut auftritt, öffnen Sie einen Support-Fall über den Case Manager-Link unter https://www.juniper.net/support/ oder rufen Sie 1-888-314-5822 (gebührenfrei, USA und Kanada) oder 1-408-745-9500 (von außerhalb der USA) an.

Austausch im laufenden Betrieb

Es treten zu viele Hot-Swap-Interrupts auf.

Major (rot)

Ersetzen Sie die ausgefallenen Komponenten.

Netzteile

Ein Netzteil wurde aus dem Gehäuse entfernt.

Minor (gelb)

Installieren Sie ein Netzteil im leeren Steckplatz.

Ein Netzteil hat eine hohe Temperatur.

Major (rot)

Ersetzen Sie das ausgefallene Netzteil.

Ein Netzteileingang ist ausgefallen.

Major (rot)

Überprüfen Sie den Anschluss des Netzteileingangs und das Netzkabel.

Ein Netzteilausgang ist ausgefallen.

Major (rot)

Überprüfen Sie die Ausgangsverbindung der Stromversorgung.

Ein Netzteil ist ausgefallen.

Major (rot)

Ersetzen Sie das ausgefallene Netzteil.

AC- und DC-Netzteile sind installiert.

Major (rot)

Mischen Sie keine Wechsel- und Gleichstromnetzteile.

Unzureichende Anzahl von Netzteilen.

Major (rot)

Installieren Sie ein zusätzliches Netzteil.

Aktueller Freigabeausfall Major (rot) Der PSM-Status bleibt während des aktuellen Freigabefehlers online. Wenn auf Geräten mit Netzteilen der dritten Generation ein Stromfreigabefehler auftritt, zeigt das System den Fehler nicht auf der LED an und ändert den PSM-Status nicht in Fehler. Stattdessen hält das System den PSM-Status online und löst einen Alarm aus.

Es ist keine Aktion erforderlich.

mcu_access_failure

Major (rot)

Wenn die mcu_access_failure angezeigt wird, aber nicht den Status als Fehler anzeigt und das PSM die Ausgangsleistung liefert, deutet dies auf einen Umgebungsausfall des PSM hin.

Wenn Sie den PSM-Watchdog aktiviert haben, wird der PSM als Ausfallsicherheitsaktion deaktiviert.

PSM I2C SCL-Fehler Major (rot) Wenn in einem Gehäuse mit 8 Steckplätzen der SCL-Pin (Serial Clock Line) von I2C aufgrund einer Taktverlängerung auf dem übergeordneten/primären PSM0 einen Kurzschluss zum GND-Pin (Masse) im übergeordneten/primären PSM0 aufweist, wirkt sich dies auf Transaktionen auf allen untergeordneten/sekundären PSMs aus. Sie können den Status des PSM aufgrund eines "hwdre"-Fehlers nicht sehen. Isolieren Sie in solchen Fällen das fehlerhafte PSM, indem Sie das fehlerhafte PSM iterativ entfernen und identifizieren, und ersetzen Sie das fehlerhafte PSM. Wenn wir die PSMs austauschen und immer noch ein Fehler auf allen PSMs verbleibt, ist es möglich, dass ein Fehler im Gehäuse / in der Mittelebene vorliegt. Sie können dann dafür eine RMA erheben.

Beispiel: Wenn ein Fehler bei PSM0 und den nachfolgenden PSMs (PSM1 bis PSM3) auftritt, liegt der Fehler möglicherweise in PSM0. Sie müssen das PSM0 mit einem anderen PSM desselben Primärnetzwerks (PSM1, PSM2 oder PSM3) austauschen und prüfen, ob es behoben ist.

Wenn Sie einen Fehler bei PSM4 und den nachfolgenden untergeordneten/sekundären PSMs (PSM5) sehen, kann der Fehler bei PSM4 liegen. Sie müssen das PSM4 mit PSM5 austauschen (da PSM4 das primäre PSM ist) und prüfen, ob es behoben ist.

Versagen des kurzen Stifts Major (rot) Durch einen kurzen Pinausfall kann das Netzteil erkennen, ob es richtig mit der Mittelebene verbunden ist. Wenn das Netzteilmodul (PSM) erkannt wird, schaltet es den Ausgang ein. Da dieses Problem außerhalb des PSM auftritt, wird es nicht als PSM-Fehler betrachtet. Folglich leuchtet die Fehler-LED nicht rot.

Versuchen Sie, das Gerät erneut einzufügen, und geben Sie das PSM (RMA) zurück, wenn der Fehler weiterhin besteht, da keine Midplane-Konnektivität vorhanden ist.

Einkanal-PFC-Ausfall Major (rot) Wenn auf einem einzelnen Kanal ein PFC-Fehler auftritt, leuchtet die Fehler-LED nicht rot und PSM bleibt im Online-Zustand, da der PSM-Ausgang noch eingeschaltet ist. Wenn jedoch alle vier Kanäle ausfallen, leuchtet die Fehler-LED rot und PSM wird in den Fehlerzustand versetzt.

Es ist keine Aktion erforderlich.

Temperatur

Die Gehäusetemperatur hat 40 °C überschritten, die Lüfter wurden auf volle Geschwindigkeit eingeschaltet und ein oder mehrere Lüfter sind ausgefallen.

Minor (gelb)

  • Raumtemperatur prüfen.

  • Überprüfen Sie den Luftstrom.

  • Ersetzen Sie den Lüftereinschub.

Die Gehäusetemperatur hat 65 °C überschritten, und die Lüfter wurden auf volle Drehzahl geschaltet.

Minor (gelb)

  • Raumtemperatur prüfen.

  • Überprüfen Sie den Luftstrom.

  • Überprüfen Sie die Lüfter.

Die Gehäusetemperatur hat 65 °C überschritten, und ein Lüfter ist ausgefallen. Wenn dieser Zustand länger als 90 Sekunden anhält, wird der Router heruntergefahren.

Major (rot)

  • Raumtemperatur prüfen.

  • Überprüfen Sie den Luftstrom.

  • Überprüfen Sie den Lüfter.

Die Gehäusetemperatur hat 75 °C (167 °F) überschritten. Wenn dieser Zustand länger als 90 Sekunden anhält, wird der Router heruntergefahren.

Major (rot)

  • Raumtemperatur prüfen.

  • Überprüfen Sie den Luftstrom.

  • Lüfter prüfen.

Der Temperatursensor ist ausgefallen.

Major (rot)

Eröffnen Sie einen Support-Fall über den Case Manager-Link unter https://www.juniper.net/support/ oder rufen Sie 1-888-314-5822 (gebührenfrei, USA und Kanada) oder 1-408-745-9500 (von außerhalb der USA) an.