Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

Alarmmeldungen

Grundlegendes zu Alarmen

Der MX10008-Router unterstützt verschiedene Alarmtypen und Schweregrade. Tabelle 1 enthält eine Liste von Alarmbegriffen und -definitionen, die Ihnen bei der Überwachung des Geräts helfen können.

Tabelle 1: Begriffe und Definitionen von Alarmen

Ausdruck

Definition

Alarm

Signal, das Sie vor Bedingungen warnt, die den normalen Betrieb verhindern könnten. Auf dem Gerät können Alarmanzeigen das LCD-Display und die LEDs des Geräts umfassen. Auf dem LCD-Display (sofern vorhanden) wird die Anzahl der Gehäuse-Alarmmeldungen angezeigt. Blinkende gelbe LEDs weisen auf geringfügige Alarmzustände für Fahrwerkskomponenten hin.

Alarmzustand

Fehlerereignis, das einen Alarm auslöst.

Schweregrad des Alarms

Schwere des Alarms. Der Schweregrad kann entweder schwerwiegend (gelb) oder geringfügig (rot) sein.

  • Schwerwiegend (gelb oder gelb) – Weist auf eine kritische Situation auf dem Gerät hin, die auf eine der folgenden Bedingungen zurückzuführen ist.

    Eine gelbe Alarmbedingung erfordert sofortiges Handeln.

    • Eine oder mehrere Hardwarekomponenten sind ausgefallen.

    • Eine oder mehrere Hardwarekomponenten haben Temperaturschwellenwerte überschritten.

    • Eine Alarmbedingung, die auf einer Schnittstelle konfiguriert ist, hat eine kritische Warnung ausgelöst.

  • Geringfügig (rot): Weist auf einen unkritischen Zustand des Geräts hin, der, wenn er ignoriert oder nicht behoben wird, zu einer Unterbrechung des Dienstes oder einer Verringerung der Leistung führen kann.

    Ein roter Alarmzustand erfordert eine Überwachung oder Wartung. Beispielsweise erzeugt eine fehlende Rettungskonfiguration einen roten Systemalarm.

Alarmtypen

Zu den Alarmtypen gehören die folgenden:

  • Gehäusealarm: Vordefinierter Alarm, der durch einen physischen Zustand des Geräts ausgelöst wird, z. B. einen Netzteilausfall oder eine zu hohe Komponententemperatur.

  • Schnittstellenalarm: Alarm, den Sie so konfigurieren, dass Sie benachrichtigt werden, wenn eine Schnittstellenverbindung ausgefallen ist. Gilt für ethernet, fibre-channelund management-ethernet Schnittstellen. Sie können einen roten (major) oder gelben (minor) Alarm für die Verknüpfungsbedingung konfigurieren oder die Bedingung ignorieren lassen.

  • Systemalarm: Vordefinierter Alarm, der durch eine fehlende Rettungskonfiguration, einen Fehler bei der Installation einer Lizenz für eine lizenzierte Softwarefunktion oder eine hohe Festplattenauslastung ausgelöst werden kann.

Schnittstellen-Alarmmeldungen

Sie konfigurieren Schnittstellenalarme so, dass Sie benachrichtigt werden, wenn eine Schnittstelle ausgefallen ist.

Um eine Schnittstellenverbindungsbedingung so zu konfigurieren, dass sie einen roten oder gelben Alarm auslöst, oder um die Verbindungsbedingung so zu konfigurieren, dass sie ignoriert wird, verwenden Sie die alarm Anweisung auf der Hierarchieebene [edit chassis]. Sie können den Schnittstellentyp , oder management-ethernet angebenethernetfibre-channel.

Standardmäßig werden größere Alarme für Schnittstellenverbindungsbedingungen auf der Steuerungsebene und für Managementnetzwerkschnittstellen in einem MX10008-Router konfiguriert. Die Verbindungsalarme weisen darauf hin, dass die Verbindung zum Steuerungsebenennetzwerk unterbrochen ist. Sie können diese Alarme so konfigurieren, dass sie ignoriert werden, indem Sie die alarm Anweisung auf der Hierarchieebene [edit chassis] verwenden.

In Tabelle 2 werden die Gehäuse-Alarmmeldungen des Routers beschrieben.

Tabelle 2: Alarmbedingungen für Gehäusekomponenten

Chassis-Komponente

Alarmbedingung

Schweregrad des Alarms

Heilmittel

Routing-Control Board

Ein RCB ist ausgefallen.

Major (rot)

Ersetzen Sie den ausgefallenen RCB.

Ein RCB wurde entfernt.

Minor (gelb)

Installieren Sie einen RCB in dem leeren Steckplatz.

Linecards

Eine Linecard ist offline.

Minor (gelb)

Überprüfen Sie die Linecard. Entfernen Sie die Linecard, und installieren Sie sie erneut. Wenn dies fehlschlägt, ersetzen Sie die ausgefallene Karte.

Eine Linecard ist fehlgeschlagen.

Major (rot)

Ersetzen Sie die fehlerhafte Linecard.

Eine Linecard wurde entfernt.

Major (rot)

Installieren Sie eine Linecard im leeren Steckplatz.

Lüftereinschübe

Ein Lüfterfach wurde aus dem Gehäuse entfernt.

Major (rot)

Setzen Sie das fehlende Lüfterfach ein.

Ein Lüfter im Gehäuse dreht sich nicht oder unterschreitet die erforderliche Drehzahl.

Major (rot)

Setzen Sie das Lüfterfach wieder ein.

Ein Lüfter wird nicht vom Controller für das Lüfterfach mit Strom versorgt.

Major (rot)

Überprüfen und ersetzen Sie bei Bedarf den ausgefallenen Lüfterfach-Controller.

Controller für Lüftereinschub

Ein Lüfterfach-Controller ist ausgefallen.

Minor (gelb)

Überprüfen und ersetzen Sie bei Bedarf den ausgefallenen Lüfterfach-Controller.

Einer der Controller für den Lüfterfach im Gehäuse wird nicht mit Strom versorgt.

Major (rot)

Prüfen Sie die Stromversorgung.

Switch Interface Boards (SIBs)

Einer der SIBs ist ausgefallen.

Minor (gelb)

Überprüfen Sie die folgenden Punkte:

  • Die SIB wird nicht mit Strom versorgt.

  • Der Controller für das Lüfterfach hat ein Problem mit der Stromversorgung.

Ethernet

Die Ethernet-Managementschnittstelle auf dem RCB ist ausgefallen.

Minor (gelb)

  • Überprüfen Sie die Verbindung des Schnittstellenkabels.

  • Starten Sie das System neu.

  • Wenn der Alarm erneut auftritt, eröffnen Sie einen Supportfall über den Case Manager-Link unter https://www.juniper.net/support/ oder rufen Sie 1-888-314-5822 (gebührenfrei, USA und Kanada) oder 1-408-745-9500 (von außerhalb der USA) an.

Austausch im laufenden Betrieb

Es treten zu viele Hot-Swap-Interrupts auf.

Major (rot)

Ersetzen Sie die ausgefallenen Komponenten.

Stromversorgungen

Ein Netzteil wurde aus dem Gehäuse entfernt.

Minor (gelb)

Installieren Sie ein Netzteil im leeren Steckplatz.

Ein Netzteil hat eine hohe Temperatur.

Major (rot)

Ersetzen Sie das ausgefallene Netzteil.

Ein Netzteileingang ist ausgefallen.

Major (rot)

Prüfen Sie den Netzteileingang und das Netzkabel.

Ein Netzteilausgang ist ausgefallen.

Major (rot)

Prüfen Sie den Ausgang des Netzteils.

Eine Stromversorgung ist ausgefallen.

Major (rot)

Ersetzen Sie das ausgefallene Netzteil.

AC- und DC-Netzteile sind installiert.

Major (rot)

Mischen Sie keine AC- und DC-Netzteile.

Unzureichende Anzahl von Netzteilen.

Major (rot)

Installieren Sie ein zusätzliches Netzteil.

Aktueller Freigabeausfall Major (rot) Der PSM-Status bleibt während des Ausfalls der aktuellen Freigabe online. Wenn bei Geräten mit Netzteilen der dritten Generation ein Stromfreigabeausfall auftritt, zeigt das System den Fehler nicht auf der LED an und ändert den PSM-Status nicht in Fehler. Stattdessen hält das System den PSM-Status online und löst einen Alarm aus.

Es ist keine Aktion erforderlich.

mcu_access_failure

Major (rot)

Wenn der mcu_access_failure angezeigt wird, aber nicht den Zustand als Fehler anzeigt und das PSM die Ausgangsleistung liefert, deutet dies auf einen Umgebungsfehler des PSM hin.

Wenn Sie den PSM-Watchdog aktiviert haben, wird der PSM als Resilienzaktion deaktiviert.

PSM, I2C, SCL-Fehler Major (rot) Wenn in einem Gehäuse mit 8 Steckplätzen der SCL-Pin (Serial Clock Line) von I2C aufgrund von Taktdehnung auf dem PSM0 mit dem GND-Pin (Masse) im übergeordneten/primären PSM0 kurzgeschlossen wird, wirkt sich dies auf Transaktionen auf allen untergeordneten/sekundären PSMs aus. Sie können den Status des PSM aufgrund eines "hwdre"-Fehlers nicht sehen. Isolieren Sie in solchen Fällen den fehlerhaften PSM, indem Sie den fehlerhaften PSM iterativ entfernen und identifizieren, und ersetzen Sie den fehlerhaften PSM. Wenn wir die PSMs austauschen und immer noch ein Fehler auf allen PSMs vorhanden ist, ist es möglich, dass ein Fehler im Chassis/in der Midplane vorliegt. Sie können dann dafür eine RMA erstellen.

Beispiel: Wenn Sie einen Fehler bei PSM0 und den nachfolgenden PSMs (PSM1 bis PSM3) sehen, liegt der Fehler möglicherweise in PSM0. Sie müssen den PSM0 mit einem anderen PSM desselben primären PSM (PSM1, PSM2 oder PSM3) austauschen und prüfen, ob er behoben ist.

Wenn ein Fehler bei PSM4 und den nachfolgenden untergeordneten/sekundären PSMs (PSM5) angezeigt wird, liegt der Fehler möglicherweise in PSM4. Sie müssen PSM4 durch PSM5 ersetzen (da PSM4 das primäre PSM ist) und prüfen, ob es behoben ist.

Kurzer Stiftausfall Major (rot) Durch einen kurzen Pin-Ausfall kann das Netzteil erkennen, ob es richtig mit der Mid-Plane verbunden ist. Wenn dies erkannt wird, schaltet sich das Stromversorgungsmodul (PSM) am Ausgang ein. Da dieses Problem außerhalb des PSM auftritt, wird es nicht als PSM-Fehler betrachtet. Folglich leuchtet die Fehler-LED nicht rot.

Versuchen Sie, den Vorgang erneut einzusetzen, und geben Sie den PSM (RMA) zurück, wenn der Fehler weiterhin besteht, da keine Midplane-Konnektivität vorhanden ist.

Einkanaliger PFC-Ausfall Major (rot) Wenn auf einem einzelnen Kanal ein PFC-Fehler auftritt, leuchtet die Fehler-LED nicht rot und PSM bleibt im Online-Zustand, da der PSM-Ausgang noch eingeschaltet ist. Wenn jedoch alle vier Kanäle ausfallen, leuchtet die Fehler-LED rot und PSM wird in den Fehlerzustand versetzt.

Es ist keine Aktion erforderlich.

Temperatur

Die Gehäusetemperatur hat 40 °C überschritten, die Lüfter wurden auf volle Geschwindigkeit eingeschaltet und ein oder mehrere Lüfter sind ausgefallen.

Minor (gelb)

  • Prüfen Sie die Raumtemperatur.

  • Prüfen Sie den Luftstrom.

  • Setzen Sie das Lüfterfach wieder ein.

Die Gehäusetemperatur hat 65 °C überschritten und die Lüfter wurden auf volle Geschwindigkeit eingestellt.

Minor (gelb)

  • Prüfen Sie die Raumtemperatur.

  • Prüfen Sie den Luftstrom.

  • Überprüfe die Lüfter.

Die Gehäusetemperatur hat 65 °C überschritten und ein Lüfter ist ausgefallen. Wenn dieser Zustand länger als 90 Sekunden anhält, wird der Router heruntergefahren.

Major (rot)

  • Prüfen Sie die Raumtemperatur.

  • Prüfen Sie den Luftstrom.

  • Überprüfe den Lüfter.

Die Gehäusetemperatur hat 75 °C überschritten. Wenn dieser Zustand länger als 90 Sekunden anhält, wird der Router heruntergefahren.

Major (rot)

  • Prüfen Sie die Raumtemperatur.

  • Prüfen Sie den Luftstrom.

  • Lüfter prüfen.

Der Temperatursensor ist ausgefallen.

Major (rot)

Eröffnen Sie einen Support-Fall über den Link Case Manager unter https://www.juniper.net/support/ oder rufen Sie 1-888-314-5822 (gebührenfrei, USA und Kanada) oder 1-408-745-9500 (von außerhalb der Vereinigten Staaten) an.