1つのノードがプライマリ状態で、もう1つのノードが喪失状態にあるSRXシャーシクラスタのトラブルシューティング
問題
説明
SRXシャーシクラスターのノードがプライマリおよび損失状態である。
環境
SRXシャーシクラスタ
症状
クラスタの 1 つのノードはプライマリ状態にあり、もう 1 つのノードは損失状態です。各ノードで show chassis cluster status
コマンドを実行して、ノードのステータスを表示します。出力例を次に示します。
{primary:node0} root@primary-srx> show chassis cluster status Cluster ID: 1 Node Priority Status Preempt Manual failover Redundancy group: 0 , Failover count: 1 node0 100 primary no no node1 0 lost no no Redundancy group: 1 , Failover count: 1 node0 100 primary no no node1 0 lost no no
診断
失われた状態のノードの電源はオンになっていますか?
はい: コンソール・ポートを介して、失われた状態にあるノードにアクセスできますか。ノードへのアクセスに Telnet または SSH を使用しないでください。
ノードにアクセスできる場合は、ステップ 3 に進みます。
ノードにアクセスできず、デバイスが遠隔地にある場合は、コンソールからノードにアクセスし、さらにトラブルシューティングを行います。コンソールにアクセスできるのに出力が表示されない場合は、ハードウェアの問題を示している可能性があります。さらなるトラブルシューティングのために、テクニカルサポート担当者とケースを開いてください。 カスタマーサポート向けのデータ収集を参照してください。
いいえ: ノードの電源をオンにして、ステップ 2 に進みます。
-
両方のノードの電源がオンになったら、コマンドを再度実行します
show chassis cluster status
。ノードはまだ失われた状態ですか?-
はい: コンソール・ポートを介して、失われた状態にあるノードにアクセスできますか。ノードへのアクセスに Telnet または SSH を使用しないでください。
-
ノードにアクセスできる場合は、ステップ 3 に進みます。
-
ノードにアクセスできず、ノードがリモート・ロケーションにある場合は、さらにトラブルシューティングを行うためにコンソールからノードにアクセスします。コンソールにアクセスできるのに出力が表示されない場合は、ハードウェアの問題を示している可能性があります。さらなるトラブルシューティングのために、テクニカルサポート担当者とケースを開いてください。 カスタマーサポート向けのデータ収集を参照してください。
-
-
いいえ: デバイスの電源を入れると、問題が解決しました。
-
-
コンソールをプライマリノードに接続し、コマンドを実行します
show chassis cluster status
。出力には、このノードがプライマリとして表示され、もう一方のノードが失われたと表示されますか?-
はい: これは、スプリットブレイン シナリオを示している可能性があります。各ノードはそれ自体をプライマリとして表示し、もう一方のノードは損失として表示されます。次のコマンドを実行して、トラフィックを処理しているノードを確認します。
-
show security monitoring
-
show security flow session summary
-
monitor interface traffic
トラフィックを処理していないノードを分離します。制御リンクとファブリックリンク以外のすべてのケーブルを取り外すことで、ノードをネットワークから分離できます。手順 4 に進みます。
-
-
いいえ: ステップ 4 に進みます。
-
-
コマンドを実行して、失われた状態の
show chassis fpc pic-status
ノードですべてのFPCがオンラインであることを確認します。すべてのFPCがオンラインですか?-
はい: ステップ 5 に進みます。
-
いいえ: さらにトラブルシューティングを行うために、テクニカル サポート担当者にケースを開いてください。 カスタマーサポート向けのデータ収集を参照してください。
-
-
ノードはスイッチを介して接続されていますか?
-
はい:SRXシャーシ クラスタでのファブリック リンク障害のトラブルシューティングおよび SRXシャーシ クラスタでの制御リンク障害のトラブルシューティングを参照してください。
-
いいえ: ステップ 6 に進みます。
-
-
現在プライマリであるノードから構成のバックアップを作成します。
{primary:node0}
root@primary-srx# show configuration | save /var/tmp/cfg-bkp.txt
失われた状態のノードに設定をコピーし、その設定を読み込みます。
root@lost-srx# load override <terminal or filename>
メモ:オプションを使用する場合は
terminal
、完全な設定をウィンドウに貼り付けます。設定の最後に必ず Ctrl+D を使用してください。このオプション
filename
を使用する場合は、コンフィギュレーション・ファイルへのパス(例:/ var/tmp/Primary_saved.conf)を指定して、Enter キーを押します。コンソールを介して失われた状態のノードに接続すると、状態がプライマリまたは保留/無効のいずれかとして表示される場合があります。ノードが保留/無効状態の場合、デバイスが損失状態になる前にファブリックリンク障害が発生した可能性があります。この問題のトラブルシューティングを行うには、 『SRXシャーシクラスターでのファブリックリンク障害のトラブルシューティング』の手順に従います。
コンフィギュレーションがロードされた後に変更をコミットします。問題が解決しない場合は、このデバイスの既存のコントロールリンクとファブリックリンクを新しいケーブルに交換し、ノードを再起動します。
{primary:node1}[edit]
root@lost-srx# request system reboot
問題は解決しましたか?
-
いいえ: さらにトラブルシューティングを行うために、テクニカル サポート担当者にケースを開いてください。 カスタマーサポート向けのデータ収集を参照してください。
-