Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

MXシリーズルーターの接続喪失によるファブリック関連障害の検知と復旧

ルーターの接続損失は、そのルーターのインターフェイスがアクティブな状態を維持しているにもかかわらず、ルーターが他の隣接ルーターにデータパケットを送信できない場合に発生します。その結果、隣接する他のルーターは影響を受けたルーターにトラフィックを転送し続け、他のルーターに通知を送信せずに到着したパケットをドロップします。

ルーター内のパケット転送エンジンが、同じルーター内のデータプレーンを介して他のパケット転送エンジンにトラフィックを送信できない場合、インターフェイスはコントロールプレーン上でアクティブとしてアドバタイズされますが、ルーターは隣接ルーターにパケットを送信できません。ファブリックの障害は、接続が失われる原因の 1 つである可能性があります。

以下のファブリック障害シナリオが考えられます:

  • コントロールボードの取り外し

  • 高速リンク 2(HSL2)トレーニングの失敗

  • ラインカードのシングルリンク障害

  • 同じラインカードまたは同じファブリックプレーンで複数のリンク障害が発生した場合

  • ラインカードまたはファブリックプレーンでランダムに複数のリンク障害が発生する

  • 断続的な巡回冗長性検査(CRC)エラー

  • 1 つの宛先のみの接続が完全に失われ、他の宛先への接続は失われない

何らかの理由でラインカードがデバイス内の他のラインカードにトラフィックを転送しない場合、ルーティングエンジン上の制御プロトコルはこの状態を検出できません。トラフィック伝送は、機能しているアクティブなラインカードに迂回されず、代わりに、パケットは影響を受けたラインカードに引き続き送信され、その時点で破棄されます。ラインカードがトラフィックを転送できない理由としては、以下が考えられます。

  • システム内のすべての平面が Offline または Fault 状態です。

  • ラインカード上のすべてのパケット転送エンジンが、宛先エラーによりファブリックストリームを無効にしている可能性があります。

すべてのSCB(スイッチコントロールボード)がラインカードへの接続を失うと、すべてのインターフェイスがダウンします。ラインカードのパケット転送エンジンがファブリックとの間の完全な接続を失うと、そのラインカードは停止します。

システム ハードウェアの障害には、次の種類があります。

  • 1 回の発生、または短期間のまれな障害 (環境スパイクなど)。この障害は、ファブリックプレーンを再起動し、必要に応じてラインカードとファブリックプレーンを再起動することで、手動による介入なしで効果的に修復されます。

  • 頻繁に発生する障害の繰り返し。

  • 恒久的な障害。

複数のプレーンで複数の パケット転送エンジン の宛先タイムアウトが発生するなど、スループットが低下した場合からの回復は試みられません。接続の復元は、すべてのプレーンが Offline または Fault 状態にある場合、またはすべてのアクティブなプレーンで宛先に到達できない場合にのみ試行されます。

宛先タイムアウトの共通の送信元または共通の宛先である特定のラインカードが原因で接続が失われた場合、[edit chassis fabric degraded]階層レベルでaction-fpc-restart-disableステートメントを設定している場合は、リカバリーアクションは実行されません。show chassis fabric reachabilityコマンド出力を使用して、ファブリックとラインカードのステータスを確認できます。アラームがトリガーされ、特定のラインカードが接続の損失を引き起こしていることを示します。