Fehlerbehebung bei einem SRX-Chassis-Cluster mit einem Knoten im primären Zustand und dem anderen Knoten im verlorenen Zustand
Problem
Beschreibung
Die Knoten des SRX-Chassis-Clusters befinden sich im primären Zustand und im verlorenen Zustand.
Umwelt
SRX-Chassis-Cluster
Symptome
Ein Knoten des Clusters befindet sich im primären Zustand, und der andere Knoten befindet sich im verlorenen Zustand. Führen Sie den show chassis cluster status Befehl auf jedem Knoten aus, um den Status des Knotens anzuzeigen. Hier ist eine Beispielausgabe:
{primary:node0}
root@primary-srx> show chassis cluster status
Cluster ID: 1
Node Priority Status Preempt Manual failover
Redundancy group: 0 , Failover count: 1
node0 100 primary no no
node1 0 lost no no
Redundancy group: 1 , Failover count: 1
node0 100 primary no no
node1 0 lost no no
Diagnose
Ist der Knoten, der sich im Status "Verloren" befindet, eingeschaltet?
Ja: Können Sie über einen Konsolenport auf den Knoten zugreifen, der sich im Status "Verloren" befindet? Verwenden Sie nicht Telnet oder SSH, um auf den Knoten zuzugreifen.
Wenn Sie auf den Knoten zugreifen können, fahren Sie mit Schritt 3 fort.
Wenn Sie nicht auf den Knoten zugreifen können und sich das Gerät an einem Remote-Standort befindet, greifen Sie zur weiteren Fehlerbehebung über eine Konsole auf den Knoten zu. Wenn Sie Zugriff auf die Konsole haben, aber keine Ausgabe sehen, kann dies auf ein Hardwareproblem hindeuten. Eröffnen Sie einen Fall bei Ihrem Mitarbeiter des technischen Supports, um weitere Fehler zu beheben. Weitere Informationen finden Sie unter Datenerfassung für den Kundensupport.
Nein: Schalten Sie den Knoten ein und fahren Sie mit Schritt 2 fort.
-
Führen Sie den
show chassis cluster statusBefehl nach dem Einschalten beider Knoten erneut aus. Befindet sich der Knoten noch im Status "Verloren"?-
Ja: Können Sie über einen Konsolenport auf den Knoten zugreifen, der sich im Status "Verloren" befindet? Verwenden Sie nicht Telnet oder SSH, um auf den Knoten zuzugreifen.
-
Wenn Sie auf den Knoten zugreifen können, fahren Sie mit Schritt 3 fort.
-
Wenn Sie nicht auf den Knoten zugreifen können und sich der Knoten an einem Remote-Standort befindet, greifen Sie zur weiteren Fehlerbehebung über eine Konsole auf den Knoten zu. Wenn Sie Zugriff auf die Konsole haben, aber keine Ausgabe sehen, kann dies auf ein Hardwareproblem hindeuten. Eröffnen Sie einen Fall bei Ihrem Mitarbeiter des technischen Supports, um weitere Fehler zu beheben. Weitere Informationen finden Sie unter Datenerfassung für den Kundensupport.
-
-
Nein: Das Problem wurde durch Einschalten des Geräts behoben.
-
-
Verbinden Sie eine Konsole mit dem primären Knoten, und führen Sie den
show chassis cluster statusBefehl aus. Zeigt die Ausgabe diesen Knoten als primären und den anderen Knoten als verloren an?-
Ja: Dies könnte auf ein Split-Brain-Szenario hindeuten. Jeder Knoten würde sich selbst als primär und der andere Knoten als verloren anzeigen. Führen Sie die folgenden Befehle aus, um zu überprüfen, welcher Knoten den Datenverkehr verarbeitet:
-
show security monitoring -
show security flow session summary -
monitor interface traffic
Isolieren Sie den Knoten, der den Datenverkehr nicht verarbeitet. Sie können den Knoten vom Netzwerk isolieren, indem Sie alle Kabel mit Ausnahme der Steuerungs- und Fabric-Verbindungen entfernen. Fahren Sie mit Schritt 4 fort.
-
-
Nein: Fahren Sie mit Schritt 4 fort.
-
-
Stellen Sie sicher, dass alle FPCs auf dem Knoten, der sich im Status "Verloren" befindet, online sind, indem Sie den
show chassis fpc pic-statusBefehl ausführen. Sind alle FPCs online?-
Ja: Fahren Sie mit Schritt 5 fort.
-
Nein: Wenden Sie sich zur weiteren Fehlerbehebung an Ihren Mitarbeiter beim technischen Support. Weitere Informationen finden Sie unter Datenerfassung für den Kundensupport.
-
-
Sind die Knoten über einen Switch verbunden?
-
Ja: Weitere Informationen finden Sie unter Fehlerbehebung bei einem Fabric-Link-Ausfall in einem SRX-Chassis-Cluster und Fehlerbehebung bei einem Control-Link-Ausfall in einem SRX-Chassis-Cluster.
-
Nein: Fahren Sie mit Schritt 6 fort.
-
-
Erstellen Sie eine Sicherungskopie der Konfiguration von dem Knoten, der derzeit der primäre Knoten ist:
{primary:node0}root@primary-srx# show configuration | save /var/tmp/cfg-bkp.txtKopieren Sie die Konfiguration auf den Knoten, der sich im Status "Verloren" befindet, und laden Sie die Konfiguration:
root@lost-srx# load override <terminal or filename>Anmerkung:Wenn Sie die
terminalOption verwenden, fügen Sie die vollständige Konfiguration in das Fenster ein. Stellen Sie sicher, dass Sie am Ende der Konfiguration Strg+D verwenden.Wenn Sie die
filenameOption verwenden, geben Sie den Pfad zur Konfigurationsdatei ein (z. B. /var/tmp/Primary_saved.conf), und drücken Sie die Eingabetaste.Wenn Sie über eine Konsole eine Verbindung mit dem Knoten herstellen, der sich im Status "Verloren" befindet, wird der Status möglicherweise als "Primär" oder "Gehalten/Deaktiviert" angezeigt. Wenn sich der Knoten im angehaltenen/deaktivierten Zustand befindet, ist möglicherweise ein Fabric-Link-Fehler aufgetreten, bevor das Gerät in den Status "Verloren" wechselte. Um dieses Problem zu beheben, führen Sie die Schritte unter Fehlerbehebung bei einem Fabric Link-Ausfall in einem SRX-Chassis-Cluster aus.
Bestätigen Sie die Änderungen, nachdem die Konfiguration geladen wurde. Wenn das Problem weiterhin besteht, ersetzen Sie die vorhandenen Steuerungs- und Fabric-Links auf diesem Gerät durch neue Kabel, und starten Sie den Knoten neu:
{primary:node1}[edit]root@lost-srx# request system rebootIst das Problem behoben?
-
Nein: Wenden Sie sich zur weiteren Fehlerbehebung an Ihren Mitarbeiter beim technischen Support. Weitere Informationen finden Sie unter Datenerfassung für den Kundensupport.
-