項目一覧
ファブリックの耐障害性
ファブリックの耐障害性と劣化
ジュニパーのルーターとスイッチには、通常の運用時に発生する障害やエラーに対処するための耐障害性が組み込まれています。Junosソフトウェアが即座にアクションを起こし、障害状態を修復してトラフィックの損失を最小限に抑えます。手動による介入は必要ありません。ファブリックの劣化は、このようなエラー状態につながる理由の1つである可能性があります。以下のセクションでは、PFE がこれらの障害から耐障害性を持って回復する方法について説明します。
- PTXシリーズルーターでのパケット転送エンジンのエラーと回復
- ファブリックの耐障害性と劣化したファブリックの自動リカバリー
- T640、T1600、TX Matrixルーターでのパケット転送エンジンのエラーと回復
PTXシリーズルーターでのパケット転送エンジンのエラーと回復
パケット転送エンジンの宛先は、以下の理由により、PTXシリーズルーターで到達不能になることがあります。
-
ファブリック スイッチ インターフェイス ボード(SIB)は、CLI コマンドの結果としてオフラインになっています。
-
ファブリックSIBは、高温状態のため、コントロールボードによってオフラインになっています。
-
SIBの電圧またはポーリングされたI/Oエラーは、コントロールボードによって検出されます。
-
予期しないリンク学習エラーは、接続されているすべてのプレーンで発生します。
-
2つのパケット転送エンジンはファブリックに到達できますが、互いに到達することはできません。
-
リンク エラーは、2 つのパケット転送エンジンがファブリックに接続しているが、共通のプレーンを経由していない場合に発生します。
Junos OS リリース 13.3 以降では、PTXシリーズ ルーターを使用して、パケット転送エンジン(PFE)関連のエラー レベルと、指定したしきい値に達した場合に実行するアクションを設定できます。
エラーレベルが定義されていない場合、PTXシリーズルーターは回復プロセスの次のフェーズを開始します。
-
SIB 再起動フェーズ:ルーターは、SIB を 1 つずつ再起動することで、問題の解決を試みます。SIB が正常に機能していて、1 枚のラインカードに問題がある場合、このフェーズは開始されません。
-
SIBおよびラインカード再起動フェーズ:ルーターはSIBとラインカードの両方を再起動します。再起動後にファブリックへの高速リンクを開始できないラインカードがある場合、これらのラインカード用のインターフェイスが作成されないため、ライブトラフィックの損失とは関係がなく、システムの問題を防ぐことができます。
-
ラインカードオフラインフェーズ:以前の回復の試みが失敗したため、ラインカードとインターフェイスはオフになり、システムは問題とエラー状態を回避します。
ファブリックの耐障害性と劣化したファブリックの自動リカバリー
Junos Evolvedリリース23.4R1以降、データ損失を制限するためにファブリックの自動リカバリー機能が利用可能です。実行されるリカバリー・アクションには、FRU の再起動、リンクの再起動などがあります。
次の 3 フェーズのファブリック回復アクションが FRU レベルで試行されます。
1. SIB の再起動による FRU レベルの回復。
2. FPC再起動またはPFE再起動を使用したFRUレベルの回復。
3. 回復不能なPFE、IFD無効化、またはPFEオフラインに対するアクション。
SIB 障害状態に対するファブリック回復アクション: SIBの不在(ユーザードリブンオフラインまたはシステム電源投入時にSIBが存在しない)による到達可能性障害の場合、ファブリックの耐障害性は回復を試みません。ファブリックの回復をサポートしていないシステムでは、到達可能性障害が発生するとシャーシアラームが生成されます。
PTXシリーズルーター(PTX10004、PTX10008、PTX10016ルーター)でのPFEレベル回復アクション
PFE 再起動をサポートできるプラットフォームの場合、PFE 再起動がデフォルトのフェーズ 2 リカバリー・アクションとして追加されます。
- 到達可能性障害のあるPFEは、すべて1つのFPCに存在します。
- (1つ以上のFPCで)到達可能性障害があり、共通の障害がないPFE。
フェーズ 2 の回復は、フェーズ 1 の回復後に到達可能性障害から回復していない PPFE で試行されます。
FPC内で自己到達性障害を持つPFEの数がPFEの50%以上になると、FPCが再起動されます。
次のCLIオプションを使用して、デフォルトのPFE再起動アクションを手動で設定します。
user@root> set chassis fabric event reachability-fault actions pfe-restart-disable
次の表は、FPCで障害が発生しているPFEの設定と数に基づくフェーズ2リカバリのアクションを示しています。
回復の決定 | FPC 内の関係する PFE の数 | PFE再起動をサポート | PFE再起動の無効化 | FPC再起動の無効化 | アクション |
フェーズ 2 アクション | <= 50% | はい | いいえ | x | PFE再起動 |
フェーズ 2 アクション | <= 50% | はい | はい | いいえ | FPC再起動 |
フェーズ 2 アクション | <= 50% | はい | はい | はい | PFE再起動 |
フェーズ 2 アクション | >50% | はい | x | いいえ | FPC再起動 |
フェーズ 2 アクション | >50% | はい | はい | はい | PFE再起動 |
フェーズ 2 アクション | >50% | はい | いいえ | はい | PFE再起動 |
T640、T1600、TX Matrixルーターでのパケット転送エンジンのエラーと回復
パケット転送エンジンの宛先は、以下の理由により、T640、T1600、または TX Matrix ルーターで到達できなくなることがあります。
-
ファブリック スイッチ インターフェイス ボード(SIB)は、CLI コマンドまたは物理ボタンが押された結果、オフラインになっています。
-
ファブリック SIB は、高温状態のため、スイッチ プロセッサ メザニン ボード(SPMB)によってオフラインになっています。
-
SIB の電圧またはポーリングされた I/O エラーは、SPMB によって検出されます。
-
すべてのパケット転送エンジンは、SIBがオンラインの場合でも、リモートパケット転送エンジンからすべてのプレーンで宛先エラーを受信します。
-
完全なファブリック損失は、SIBがオンラインの場合でも、宛先タイムアウトによって発生します。
回復プロセスは、次のフェーズで構成されます。
-
ルータはファブリックプレーンを1つずつ再起動します。ファブリックプレーンが正常に機能していて、単一のラインカードに問題がある場合、このフェーズは開始されません。
-
ファブリックプレーンとラインカード再起動フェーズ:ルーターは、SIBとラインカードの両方を再起動します。再起動後にファブリックへの高速リンクを開始できないラインカードがある場合、これらのラインカード用のインターフェイスが作成されないため、ライブトラフィックの損失とは関係がなく、システムの問題を防ぐことができます。
-
ラインカードのオフラインフェーズ:以前の回復の試みが失敗したため、ラインカードとインターフェイスはオフになり、システムは深刻な結果につながる問題とエラー状態を回避します。
Junos OS リリース 14.2R6 以降、高電圧や高温などの極端な条件が原因で SIB がオフラインになった場合、回復プロセスの一環として、ルーターはその SIB のファブリック プレーンを再起動しません。
上記の段階的な復旧メカニズムは、これらの問題に関連する可能性のある他のエラーがない限り、網羅的です。
Junos OS リリース 14.2R6 以降、ファブリックの self-ping と パケット転送エンジンの活性メカニズムを組み込むことで、シングルシャーシ システムでのファブリック劣化をより適切に管理できるようになりました。ファブリックの self-ping は、ファブリックのデータパスの問題を検出するメカニズムです。ファブリックのself-pingメカニズムを使用して、すべてのパケット転送エンジンは、パケットがファブリックパスを介して送信されたときに、それ自体を宛先とするパケットが自分に到達していることを確認します。パケット転送エンジン liveness は、ファブリック プレーン上でパケット転送エンジン到達可能かどうかを検出するメカニズムです。到達可能であることを確認するために、パケット転送エンジンはファブリックプレーン上で定期的に自己宛てパケットを送信します。これら 2 つのメカニズムによってエラーが検出された場合、ファブリック マネージャは ファブリック劣化アラーム を発生させ、ラインカードを再起動して回復を開始します。
MXシリーズルーターのファブリックの耐障害性
MXルーターは、ハードウェア障害のシナリオでパケットロスを削減するインテリジェントなメカニズムを提供します。MXシリーズルーターは、マルチレイヤーの物理的、論理的、プロトコルレベルの耐障害性の側面から、ネットワークとサービスの可用性を確保します
MX10008冗長性と耐障害性を提供します。電源システム、冷却システム、コントロールボードなど、すべての主要なハードウェアコンポーネントは完全に冗長化されています。
MX10004電源システムとルーティングコントロールボード(RCB)は、冗長性と耐障害性を提供します。
MX2020およびMX2010シャーシは、冗長性と耐障害性を提供します。電源システム、冷却システム、コントロールボード、スイッチファブリックなど、主要なハードウェアコンポーネントはすべて完全冗長化されています。
SFB(スイッチ ファブリック ボード)は、MX ルーター シャーシ内のサブシステムのデータ プレーンです。SFB は、拡張性と耐障害性に優れた「オールアクティブ」の一元的なスイッチ ファブリックを構築し、MX2000 ルーターの各 MPC スロットに最大 4 Tbps の全二重スイッチング性能を提供します。
MX240、MX480、MX960シャーシは、冗長性と耐障害性を提供します。ハードウェアシステムは完全冗長化されており、電源、ファントレイ、ルーティングエンジン、およびスイッチコントロールボードを備えています。
MX304ルーターは、冗長化されたプラガブルルーティングエンジンを搭載し、最大3つのラインカードMIC(LMIC)をサポートします。
このトピックには、ファブリックの耐障害性オプション、使用される障害検出方法、および是正措置について説明する以下のセクションが含まれています。
ファブリック接続の復元
パケット転送エンジン の宛先は、次の理由で到達不能になることがあります。
-
コントロールボードは、CLIコマンドまたは物理ボタンが押された結果、オフラインになります。
-
ファブリック コントロール ボードは、高温のためオフラインになっています。
-
ファブリック内の電圧またはポーリングされたI/Oエラー。
-
すべてのパケット転送エンジンは、ファブリックがオンラインの場合でも、リモートパケット転送エンジンからすべてのプレーンで宛先エラーを受信します。
-
ファブリックがオンラインであっても、宛先タイムアウトによって発生する完全なファブリック損失。
システムが到達不能なパケット転送エンジンの宛先を検出すると、ファブリック接続の復元が試行されます。復元に失敗した場合、システムはインターフェイスをオフにして、隣接するルーターでローカル保護アクションまたはトラフィックの再ルートをトリガーします。
回復プロセスは、次のフェーズで構成されます。
-
ファブリック プレーンの再起動フェーズ:ファブリック プレーンを 1 つずつ再起動することで、復元が試行されます。ファブリックプレーンが正常に機能していて、1 つのラインカードからのみエラーが報告された場合、このフェーズは開始されません。ファブリックプレーンがオフラインになった理由が接続の損失であることを指定するために、エラーメッセージが生成されます。このフェーズは、ファブリックプレーンエラーに対してのみ実行されます。
-
ファブリックプレーンとラインカードの再起動フェーズ:システムは、最初のフェーズが完了するのを待ってから、システム状態を再度調べます。第 1 フェーズを実行しても接続が復元されない場合、または 10 分以内に問題が再度発生した場合は、ファブリック プレーンとライン カードの両方を再起動して接続の復元を試みます。
[edit chassis fabric degraded]
階層レベルでaction-fpc-restart-disable
ステートメントを設定して、回復を試みたときにラインカードの再起動を無効にすると、接続が失われたことを示すアラームがトリガーされます。この第 2 段階では、次の 3 つの手順を実行します。-
PFE で宛先エラーがあるすべてのライン カードはオフラインになります。
-
ファブリックプレーンはオフラインになり、スペアプレーンから始めて 1 つずつオンラインに戻されます。
-
オフラインになったラインカードはオンラインに戻ります。
-
-
ラインカードオフラインフェーズ:システムは、システム状態を再度調べる前に、第 2 フェーズが完了するのを待ちます。以前の回復の試みが失敗したため、ラインカードをオフラインにしたり、インターフェイスをオフにしたりすることで、接続の損失は制限されます。ラインカードを再起動しても問題が解決しない場合、またはラインカードを再起動してから 10 分以内に問題が再発する場合は、このフェーズが実行されます。
3つのフェーズはタイマーによって制御されます。これらのフェーズ中に、イベント(ラインカードやファブリックプレーンのオフライン/オンライン化など)がタイムアウトすると、フェーズはそのイベントをスキップして次のイベントに進みます。タイマー コントロールのタイムアウト値は 10 分です。2 つ以上のラインカードを搭載したシステムで最初のファブリックエラーが発生した場合、ファブリックプレーンが再起動されます。次の10分以内に別のファブリックエラーが発生した場合、ファブリックプレーンとラインカードが再起動されます。ただし、2 番目のファブリック エラーが 10 分のタイムアウト期間外で発生した場合は、ファブリック プレーンのみの再起動である第 1 フェーズが実行されます。
たとえば、1 つの送信元ラインカードや 1 つの宛先ラインカードなど、すべての宛先タイムアウトが特定のラインカードにトレースされる場合は、そのラインカードのみがオフライン/オンラインになります。ファブリック プレーンはオフラインとオンラインになりません。10分以内に別のファブリック障害が発生した場合、ラインカードはオフラインになります。
デフォルトでは、システムは、著しく劣化したファブリックを検出することで、接続損失時間を制限します。ユーザーの操作は必要ありません。
劣化したファブリックのラインカード
ファブリックが劣化したラインカードをオフライン状態に移行するように設定できます。MX10008、MX10004、MX2020、MX2010、MX960、MX480、MX304、またはMX240ルーターでは、リンクエラーまたは不良ファブリックプレーンを設定できます。この設定は、ラインカードをオフラインにすると再ルーティングが速くなるような、部分的な接続損失のシナリオで特に役立ちます。ラインカードでこのオプションを設定するには、[edit chassis fpc slot-number]
階層レベルで offline-on-fabric-bandwidth-reduction
ステートメントを使用します。詳細については、MX304ルーターのファブリックプレーン管理、MX10K-LC9600およびSFB2(モデル番号:JNP10008-SF2)のファブリックプレーン管理、MX10004デバイスのファブリックプレーン管理、JNP10K-LC2101およびJNP10K-LC480のファブリックプレーン管理、MX10004およびMX10008デバイスのファブリックプレーン管理、AS MLCモジュラーキャリアカードのファブリックプレーン管理を参照してください。
単一宛先に対する接続損失のみ
特定の導入環境では、ラインカードは 1 つの宛先のみに対する完全な接続喪失を示しますが、他の宛先では適切に機能します。このようなケースが特定され、影響を受けたラインカードが回復されます。ライン カード 0 とラインカード 1 の間の接続で、アクティブ プレーンが 0、1、2、3、スペア プレーンが 4、5、6、7 であるサンプル シナリオを考えます。ライン カード 0 のプレーン 0 と 1 のシングル リンク障害が発生し、ライン カード 1 のプレーン 2 と 3 のシングル リンク障害が発生すると、2 つのライン カード間で完全な接続損失が発生します。ラインカード 0 とラインカード 1 の両方が段階的な回復モードを経て、ファブリックの修復が行われます。
アクティブコントロールボード上の冗長ファブリックモード
アクティブコントロールボードを冗長モードまたは増加ファブリック帯域幅モードに設定できます。アクティブ コントロール ボードに冗長モードを設定するには、[edit chassis fabric]
階層レベルで redundancy-mode redundant
ステートメントを使用します。
MXシリーズルーター上のラインカードの検出と是正措置
MXシリーズルーター(MX10008、MX10004、MX2020、MX2010、MX2008、MX960、MX480、またはMX304、MX240など)で、オフライン状態に移行するようにラインカードを設定できます。この機能を設定しても、システムには影響しません。この機能は、ラインカードを再起動したり、システムを再起動したりせずに設定できます。
ラインカードを無効にするように機能を設定すると、以下のシナリオが発生する可能性があります。
-
-
ファブリックエラーが原因でラインカードがオフラインになり、ラインカードをオフライン状態に移行するこの機能が無効になっている場合、ラインカードは自動的にオンライン状態に移行します。
-
ファブリック エラーが原因でライン カードがオフラインになり、ライン カードをオフライン状態に移行するこの機能が無効になっているか、他のラインカードに設定されている場合、オフラインになったラインカードは自動的にオンライン状態に移行します。
-
この設定を行ったときにオフラインになったすべてのラインカードは、
[edit chassis]
階層レベルのいずれかの設定をコミットするとオンラインに戻ります。同様に、シャーシデーモンまたはグレー スフルルーティングエンジンスイッチオーバー (GRES)動作も、ファブリックの劣化のために無効になっているラインカードがオンライン状態に移行します。
ラインカードが、必要なアクティブファブリックプレーン数よりも少ない数で稼働している場合。ラインカードが4プレーン未満で動作する場合、ファブリックトラフィックはより少ない帯域幅で動作します。
以下の条件では、ファブリックの動作帯域幅が減少する可能性があります。
-
ファブリックコントロールボードは、意図しない突然の電源シャットダウンの結果としてオフラインになります。
-
ASIC(特定用途向け集積回路)エラーにより、コントロールボードのプレーンが自動的にオフラインになります。
-
ファブリックプレーンまたはコントロールボードを手動でオフライン状態にする。
-
コントロールボードの取り外し
-
任意のプレーンでSelf-pingに失敗します。
-
アクティブ プレーンの HSL2 トレーニングが失敗しました。
-
スペア ファブリック プレーンに CRC エラーがあり、このスペア プレーンがオンラインになっている場合、CRC エラーのあるリンクは無効になります。このメカニズムは、一方向にファブリックの劣化を引き起こし、反対方向にNULLルートを引き起こす可能性があります。
-
self-ping または HSL2 トレーニングの失敗が発生すると、ファブリックプレーンは特定のラインカードに対して無効になり、他のラインカードに対してはオンラインになります。この状態は、NULL ルートも引き起こす可能性があります。
システムメンテナンス中にコントロールボードを取り外したり、ファブリックプレーンをオフライン状態に移行する必要がある場合は、帯域幅が低下したラインカードをオフライン状態にする機能を有効にする必要があります([edit chassis fpc slot-number]
階層レベルでoffline-on-fabric-bandwidth-reduction
ステートメントを使用)。
ファブリックで NULL ルートまたは動作帯域幅の減少が発生した場合は、次の修正アクションが実行されます。
-
スペアのコントロールボードの有無に関わらず、各ラインカードのself-ping状態は、ルーティングエンジンにて5秒間隔で監視されます。ファブリック・マネージャがスペア・コントロール・ボードの有無を判別
-
スイッチファブリックは、MX10008、MX10004、MX2020、MX2010、MX2000デバイスのSFB(スイッチファブリックボード)でホストされます。
-
MX10008ルーターには、最大768個の100ギガビットイーサネットポート(4x100)、192個の40ギガビットイーサネットポート、192個の100ギガビットイーサネットポート、または192個の400ギガビットイーサネットポートをサポートできるラインカード用の8スロットがあり、ラインカードスロット0〜7は、パケット転送エンジン(PFE)とイーサネットインターフェイスが1つのアセンブリに収められています。MX10008 は 6 つの SFB(スイッチ ファブリック ボード)をサポート SFB には、JNP10008-SF と JNP10008-SF2 の 2 つのモデルがあります。取り付けられている SFB は、実行中のシャーシで同じモデル タイプである必要があります。
詳細については、 Fabric-Plane-Management-on-MX10004およびMX10008-Devicesを参照してください。
-
MX10004は、コンパクトな7-Uモジュラーシャーシ、ラインカードスロット0-3シリコンラインカード(2.4Tbps、480Gbps、および9.6Tbpsスループット)を特徴とし、完全なハードウェア冗長性を備えています。SFB(スイッチ ファブリック ボード)は、MX10004のスイッチ ファブリックを作成します。各SFBには、ラインカードへのコネクタ一式と、スイッチファブリックへのルーティングおよびコントロールボード(RCB)があります。3 つの SFB は、MX10004 ルーターへのスイッチング機能を制限します。6 つの SFB がフルスループットを提供します。各 MX10004 SFB には 4 つのコネクタがあります。各コネクタはラインカードスロットと一致しているため、バックプレーンが不要です。
ファブリックプレーン管理の詳細については、 MX10004デバイスでのファブリックプレーン管理を参照してください。
-
MX10003ルーターには、モジュラー ルーティング エンジンとPFEが搭載されています。単一のPFEが、イングレスとエグレスの両方のパケット転送を実行します。ルーターには、2つの専用ラインカードスロットがあります。ルーターは、1つのプライマリと2つの冗長RCB(ルーティングおよびコントロールボード)をサポートします。
-
MX2020およびMX2010デバイスは、8つのSFBをサポートします。MX2020には、20個の専用ラインカードスロットがあります。MX2010ルーターには、10個の専用ラインカードスロットがあります ホスト サブシステムは、ルーティング エンジン(CBRE)を搭載した 2 つのコントロール ボードと、8 つの SFB(スイッチ ファブリック ボード)で構成されています。データ パケットは、SFB 上のファブリック ASIC を介して MPC 間のバックプレーンを介して転送されます。
スイッチ ファブリック ボード(SFB)により、スロットあたりのファブリック帯域幅が増加します。最大 8 個の SFB、SFB2、または
SFB3はMX2020またはMX2010ルーターに設置できます。シャーシ内のすべてのスイッチ ファブリック ボードは、同じタイプである必要があります。混合モードはサポートされていません。
-
IチップまたはIチップとTrioチップベースのラインカードを搭載し、3つのコントロールボードを搭載したMX960ルーター。
-
IチップまたはIチップを搭載したMX240またはMX480ルーターと、2つのコントロールボードを搭載したTrioチップベースのラインカード。
-
Trio ベースのライン カードのみを搭載した MX960、MX480、MX240 ルーターには、スペア コントロール ボードが搭載されているとは見なされません。
このような5秒間隔の間に、2つのラインカードが同じプレーンの障害を示している場合は、スペアのコントロールボードに切り替えます。この場合、エラーを報告したコントロールボードはオフラインになり、スペアのコントロールボードはオンラインになります。
-
-
スペアのコントロールボードが利用可能で、ラインカードを無効にする機能を設定すると、各ラインカードの self-ping 状態がルーティングエンジンで 5 秒間隔で監視されます。次の条件が発生する可能性があります。
-
5 秒間隔で、1 つのラインカードのみがプレーンの障害を示している場合、ファブリック マネージャは次の間隔を待機します。その後のインターバル中に、他のラインカードが同じプレーンの障害を示さない場合、コントロールボードのスイッチオーバーが実行されます。
-
任意の5秒間隔で、複数のラインカードが複数のコントロールボードに障害を示している場合、ファブリックマネージャは次の間隔を待機します。その後のインターバル中に同じ状態が続くと、スペアのコントロールボードが存在していても、障害のあるすべてのラインカードがオフラインになります。
-
任意の5秒間隔で、複数のコントロールボード上の複数のプレーンの障害がラインカードに示された場合、ファブリックマネージャは次の間隔を待機します。その後も同じ状態が続く場合、スペアのコントロールボードが存在していても、ラインカードはオフラインになります。
-
-
スペアプレーンが利用できない場合、単一または複数のプレーンの障害を表示すると、ラインカードはオフラインになります。ラインカードがオフラインになるのは、以前に
[edit chassis fpc slot-number]
階層レベルでoffline-on-fabric-bandwidth-reduction
ステートメントを設定した場合のみです。
T4000ルーターのファブリック障害処理について
T4000ルーターは、ファブリック帯域幅がT1600ルーターの2倍の容量を持つSIB(スイッチ インターフェイス ボード)で構成されています。ファブリックの障害管理機能は、T1600ルーターの機能と同様です。このトピックでは、T4000ルーターのファブリック障害処理機能について説明します。
ファブリック障害管理機能では、ファブリックに接続されているすべての高速リンクとファブリックコア内の高速リンクのリンク障害とリンクエラーを監視します。
障害とその場所に基づいてアクションが実行されます。アクションには次のものが含まれます。
システムログファイルにリンクエラーを報告し、この情報をルーティングエンジンに送信する。
FPC(フレキシブル ポート コンセントレータ)または SIB でリンク障害を報告し、この情報をルーティングエンジンに送信します。
SIB を
Check
状態にマーキングします。SIB を
Fault
状態に移行する。
T4000ルーターのSIBは、4:1の冗長性でファブリックのコアを形成します。冗長SIBは、アクティブSIBが機能しなくなったり、非アクティブ化されたり、削除されたりするとアクティブになります。以下は、Junos OSが監視するファブリック障害の概要を示しています。
SNMPトラップは、SIBが
Check
またはFault
として報告されるたびに生成されます。show chassis alarms
- SIB がCheck
またはFault
状態であることを示します。show chassis sibs
- SIB がCheck
またはFault
状態にあること、または SIB が初期化時に SIBOffline
状態であることを示します(これは、SIB の電源が完全にオンになっていない場合に発生します)。show chassis fabric fpcs
—FPC側でエラーになっているファブリックリンクがあるかどうかを示します。show chassis fabric sibs
- SIB 側でエラーのあるファブリック リンクがあるかどうかを示します。ルーティングエンジンにある
/var/log/messages
システムログメッセージファイルには、プレフィックスCHASSISD_FM_ERROR
のエラーメッセージがあります。SIB は
FAIL
LED を表示します。
シャーシ内のファブリック プレーンによって、シャーシが T640 ルーター、T1600 ルーター、T4000 ルーターのいずれであるかが決まります。パワー エントリー モジュール(PEM)、FPC、またはファン トレイによってシャーシのパーソナリティが決まることはありません。T4000 シャーシに古い PEM またはファン トレイが存在する場合は、アラームが発生します。ルーターは、そのファブリックプレーンに基づいて識別できます。
存在するすべてのプレーンが F16 ベースの SIB である場合、シャーシは T640 シャーシです。
存在するすべてのプレーンがSFベースのSIBである場合、シャーシはT1600シャーシです。
存在するすべてのプレーンがXFベースのSIBである場合、シャーシはT4000シャーシになります。
ファブリックプレーンの混在は、アップグレード時を除き、サポートされない設定であることに注意してください。再起動せずにシャーシのパーソナリティを変更するには、すべてのファブリックプレーンを変更し、 set chassis fabric upgrade-mode
CLIコマンドを発行してパーソナリティを確認します。 set chassis fabric upgrade-mode
CLI コマンドを発行しない場合、パーソナリティは次回のブートまで変更されません。
T4000 ルーターでは、次の障害が発生します。
ボードレベルの障害 - これらの障害は、初期化中または実行時に発生します。ボード初期化中の電源障害、高速リンク送信エラー、実行時のポーリング I/O エラーは、ボード レベルの障害の例です。
リンクレベルの障害-初期化中または実行時に発生します。初期化時のリンク トレーニング エラー(FPC または SIB の初期化時にトレーニングされる FPC と SIB 間のデータ プレーン リンクの失敗)、SIB と パケット転送エンジン 間のチャネルで検出されたエラー、実行時に検出された巡回冗長検査(CRC)エラー、およびパケット転送エンジン宛先エラーは、リンクレベルの障害の一種です。
環境条件に基づく障害 - 実行時に発生する障害です。FPC または SIB を突然取り外すと、オペレーター エラーが発生する可能性があります。SIBが熱くなりすぎたり、SIB電圧が閾値を超えたりすると、生成される誤差は環境誤差に分類されます。
次のいずれかのオプションを実装して、障害を処理できます。
エラーを記録し、アラームを発生させます。
可能な場合は、スペア プレーンに切り替えます。
平面のパーツの数を減らして続行します。
使用可能な飛行機の数を減らして続行します。
ポーリングベースの障害処理を使用します。
高速リンクエラーを監視し、手動でリンクを適切なしきい値まで下げます。
ポーリングされたI/Oエラーとリンクエラーは500ミリ秒ごとに監視され、ボード排気温度とボード電圧は10秒ごとに監視されます。
PTX5000 パケットトランスポートルーターのファブリック障害処理について
Junos OS リリース 14.1以降、PTX5000パケットトランスポートルーターは9つのSIB(スイッチインターフェイスボード)をサポートします。各FPC2-PTX-P1A FPCはスロットあたり1Tbの容量をサポートするため、ファブリック帯域幅は16テラビット/秒(Tbps)で、全二重(8Tbpsのany-to-any、ノンブロッキング、半二重)スイッチングを実現します。
ファブリック障害管理機能では、ファブリックに接続されているすべての高速リンクとファブリックコア内の高速リンクのリンク障害とリンクエラーを監視します。
PTX5000で発生する障害は、大きく次のように分類できます。
ボード障害—ルーターコンポーネントがSIBまたはFPCにアクセスする際に発生する問題や、ミッドプレーンの障害から発生する問題を含み、初期化中または実行時にSIBまたはFlexible Port Concentrator(FPC)で発生する障害。
リンク障害—初期化中または実行時にルーターの高レベルリンクで発生する障害。
環境条件による障害 - 過電圧または過熱が原因で発生する障害。オペレーターによるSIBやFPCの誤操作などが原因で発生する障害。
ルーターは、障害カテゴリーと障害の場所に基づいてアクションを実行します。アクションには次のものが含まれます。
システムログファイルにリンクエラーを報告し、この情報をルーティングエンジンに送信する。
表 1 にリストされている操作コマンドの 1 つを実行したときのリンク・エラーの表示。
表 1:動作モード コマンドの一覧 動作モードコマンド
形容
show chassis sibs
SIB(スイッチ インターフェイス ボード)のステータス情報を表示します。
show chassis fabric fpcs <slot number>
指定されたFPCスロットのファブリック状態を表示します。スロット番号が指定されていない場合は、すべてのFPCのステータスが表示されます。
show chassis fabric sibs <slot number>
SIBとFPC間の電気スイッチファブリックリンクの状態を表示します。
show chassis fabric reachability <detail>
ファブリックの宛先到達可能性の現在の状態を表示します。
show chassis fabric unreachable-destinations
到達可能な状態から到達不能な状態に移行した宛先のリストを表示します。
show pfe statistics error
パケット転送エンジン エラー統計を表示します。
show chassis fabric topology <sib_slot>
入出力リンクのトポロジーを表示します。
show chassis fabric summary
すべてのファブリックプレーンの状態と稼働時間を表示します。
FPCレベルまたはSIBレベルでリンク障害を報告し、この情報をルーティングエンジンに送信します。
show chassis alarms
操作コマンドでリンクエラー情報を報告する。SIB の 障害 状態への移行。
次のセクションでは、PTX5000ファブリックの障害処理機能について説明します。
SIBレベルの障害
次のセクションでは、SIB で発生する障害の種類とその処理方法について簡単に説明します。
SIB で発生する障害の種類
ボード フォールトとリンク フォールトは、初期化中および実行時に SIB で発生します。一部の障害は、過電圧や過熱などの環境条件、またはオペレーターがSIBを誤って処理した場合に発生します。
表 1 に示す動作モードコマンドを実行して、障害を検出します。
SIB の初期化中および実行中に、次の障害が発生する可能性があります。
SIBの電源投入の失敗、ASICのリセットの失敗、スイッチプロセッサメザニンボード(SPMB)のポーリングされたASICへのI/Oアクセスの失敗、PIC障害などのボードコンポーネントの障害、またはルーターコンポーネントへのアクセス障害などのボード障害。
リンクトレーニング中に発生する高レベルのリンクエラーなどのリンク障害。
環境条件またはオペレーターによる SIB の誤操作が原因で発生する障害。
SIB レベルの障害処理
次のリストは、初期化中、実行時、環境条件、およびオペレーターによる SIB の誤処理が原因で SIB で発生した障害をルーターがどのように処理するかを示しています。
初期化中に SIB のボード障害を処理するために、シャーシデーモン(chassisd)は SIB を 障害 状態としてマークします。SIB に障害のマークが付けられた後は、この SIB では操作は行われません。
実行時にSIBのボード障害を処理するために、chassisdはシステムログファイルにエラーを記録し、アラーム表示エラータイプを発生させ、SIBを障害としてマークします。SIB に障害のマークが付けられた後は、この SIB では操作は行われません。
実行時にSIBのリンク障害を処理するために、リンクトレーニング中にリンクエラーが発生した場合、chassisdは、エラーが発生したリンクに対応するFPCに通知して、影響を受けたSIBへのリンクを無効にします。その後、chassisd はルータ内の他のすべての FPC にエラー メッセージを送信して、障害が発生した SIB リンクの使用を停止し、リンク エラー アラームが生成されます。複数の FPC が特定の SIB に対してエラーを報告する場合、その SIB はすべての FPC で無効になり、パケット転送エンジンは影響を受ける SIB を介してトラフィックを送信しないことに注意してください。
実行時にSIBのリンク障害を処理するために、chassisdはSIBを障害としてマークし、エラーの理由を指定し、SIBは無効になります。
過電圧や過熱などの環境障害が発生した場合、SIBは直ちにオフラインになります。温度または電圧が上昇すると定期的にエラーが記録され、SIBが特定のしきい値電圧または温度を超えるとオフラインになることに注意してください。
SIB が突然削除または取り外されると、影響を受けるすべてのパケット転送エンジンは、ルーター内の他のパケット転送エンジンに到達するためにそのプレーンの使用を停止します。
FPCレベルの障害
以下のセクションでは、FPCで発生する障害の種類とその処理方法について簡単に説明します。
FPCで発生する障害の種類
ボード障害とリンク障害は、初期化中および実行時にFPCで発生します。一部の障害は、過電圧、過熱、またはオペレーターがFPCを誤って処理した場合などの環境条件が原因でも発生します。
表 1 にリストされている操作コマンドを実行して、障害を検出します。
FPC の初期化中および実行中に、次の障害が発生する可能性があります。
FPCの電源投入の失敗、ASICのリセットフェーズからの復帰の失敗、ASICへのPMBポーリングI/Oアクセスの失敗、PIC障害などのボードコンポーネントの障害、またはルーターコンポーネントアクセスの障害などのボード障害。
リンクトレーニング中に発生する高レベルのリンクエラーなどのリンク障害。
環境条件またはオペレーターによるFPCの誤操作が原因で発生した障害。
FPCレベルの障害処理
次のリストは、初期化中、実行時、環境条件、オペレーターによるFPCの誤操作が原因でFPCで発生した障害をルーターがどのように処理するかを示しています。
初期化中にFPCのボード障害を処理するために、chassisdはFPCを 障害 状態としてマークします。SIB に障害のマークが付けられた後は、この FPC で操作は行われません。
実行時にFPCのボード障害を処理するために、chassisdはシステムログファイルにエラーを記録し、アラーム表示エラータイプを発生させ、FPCを障害としてマークします。FPCが障害としてマークされた後、このFPCで操作は発生しません。
初期化中または実行中にFPCのオンボードリンクエラーを処理するために、FPCはダウンし、影響を受けるすべてのパケット転送エンジンは、ルーター内の他のパケット転送エンジンに到達するためにそのプレーンを使用することを停止します。
手記:ファブリックのリンクトレーニングプロセスがまだ完了していないため、初期化中にプレーンがダウンすることはありません。
実行時のオンボードリンクエラーは、現在の設定に基づいて解決されます。FPCが再起動されるか、エラーがログに記録されてFPCが初期化を続行します。
過電圧や過熱などの環境障害が発生した場合、FPCは直ちにオフラインになります。なお、温度や電圧が上昇すると定期的にエラーが記録され、一定の閾値電圧や温度を超えるとFPCがオフラインになります。
FPCが突然削除または取り外されると、他のすべてのパケット転送エンジンは、このFPC内のパケット転送エンジンへのトラフィックの送信を停止します。
拡張スイッチ ファブリック ボード(SFB2)のファブリック障害処理について
MX2000シリーズルーターは、スイッチファブリックボード(SFB)と拡張SFB(SFB2)をサポートしていますが、両方を同時にサポートすることはできません。SFB と SFB2 は、それぞれ 3 つのファブリック プレーンをホストします。つまり、このシャーシは合計 24 機のプレーンをサポートします。Junos OS リリース 15.1F6 と 16.1R1 では、SFB と SFB2 の両方で、各プレーンのファブリック障害処理をサポートしています。以前のリリースでは、ファブリックの障害処理は、各プレーンではなく、各SFBに対してサポートされています。
表 2 は、プレーン単位と SFB 単位のファブリック障害処理の違いを示しています。
SFB レベル(SFB) |
平面レベル(SFB および SFB2) |
---|---|
SFB上の任意のリンクの巡回冗長性検査(CRC)エラーは、SFBに表示されます。 |
SFB または SFB2 のリンクの CRC エラーは、プレーンに表示されます。 |
宛先エラーが発生すると、ラインカードはSFB(3つのプレーンすべて)を分離します。 |
宛先エラーが発生すると、ラインカードは対応するプレーンを分離します。他の飛行機は引き続き運航しています。 |
プレーン単位のファブリック障害処理には、以下のメリットがあります。
粒度の向上により、障害の特定、分離、修復に役立ちます。
アラームとログメッセージは、SFB単位ではなくプレーン単位の障害情報を提供するため、デバッグが容易になります。
SFB に障害のあるプレーンが 1 つあっても、他の 2 つのプレーンは動作を継続できます。SFB 全体をオフラインにする必要はありません。
過渡エラーが発生した場合、修復中に、跳ね返るSFBを分離する代わりに、1つのプレーンを分離できます。
24 個のプレーンすべてのファブリック障害処理情報を表示するには、既存のファブリック コマンドで extended
オプションを使用します。
帯域幅劣化の管理
特定のエラーが発生すると、通知なしにシステムによってパケットが破棄されます。他の接続システムは、引き続き影響を受けるシステムにトラフィックを転送し、ネットワークのパフォーマンスに影響を与えます。ファブリックプレーンの劣化が原因の1つである可能性があります。
デフォルトでは、ジュニパーネットワークスのルーターは、システムがパケット転送エンジンの問題を検出すると、このような状況からの修復を開始しようとします。修復に失敗した場合、システムはインターフェイスをオフにすることで、それ以上のエスカレーションを防ぎます。
Junos OSでは、[edit chassis fpc slot-numberfabric]
階層でbandwidth-degradation
設定ステートメントを使用して、ファブリックプレーンの劣化を適当と思われる方法で検出し、対応することができます。ルーターを設定して、そのような状態が検出された場合にルーターが実行する修復アクションを指定できます。また、オプションの ステートメント blackhole-action
を使用して、100%ファブリック劣化シナリオにラインカードがどのように応答するかを決定することもできます。このコマンドはオプションであり、デフォルトのファブリック強化手順を上書きします。
bandwidth-degradation
コマンドと offline-on-fabric-bandwidth-reduction
ステートメントは相互に排他的です。両方のコマンドが設定されている場合、コミットチェック中にエラーが発生します。
bandwidth-degradation
ステートメントは、パーセンテージとアクションで構成されます。percent-age
値は 1 から 99 の範囲で、ラインカードからの応答をトリガーするのに必要なファブリック劣化の割合を表します。action
属性によって、ファブリックの劣化が設定された割合に達したときにラインカードが実行する応答のタイプが決まります。
このステートメントは、ファブリック劣化の割合が100%に達したときにトリガーされる action
属性でのみ設定されます。
どちらの設定ステートメントにも、以下のアクションを適用できます。
log-only
:ファブリック劣化の閾値に達すると、メッセージがシャーシファイルとメッセージファイルに記録されます。その他のアクションは実行されません。restart
:しきい値に達すると、ファブリックプレーンが劣化したラインカードが再起動されます。offline
:ファブリックプレーンが劣化したラインカードは、しきい値に達するとオフラインになります。ラインカードをオンラインに戻すには、手動による介入が必要です。これは、アクション属性が設定されていない場合のデフォルトのアクションです。restart-then-offline
:しきい値に達すると、ファブリックプレーンが劣化したラインカードが再起動され、10分以内にファブリックプレーンの劣化が再び検出された場合、ラインカードはオフラインになります。ラインカードをオンラインに戻すには、手動による介入が必要です。
この機能は、Junos OS リリース 15.1R1 で使用できます。
PTX10Kデバイスでのファブリックの強化と回復
-
PTX10K-LC1202-36MRラインカードを搭載したPTX10001-36MR、PTX10004、PTX10008、およびPTX100016ルーター
-
PTX10K-LC1301-36DDラインカードを搭載したPTX10008ルーター
ファブリックの強化は、ファブリックのブラックホール化を検出し、パケット転送エンジンをブラックホール状態から復元するための自動回復プロセスを試行する復元力機能です。
ファブリックの強化はデフォルトで有効になっています。システムが到達不能なパケット転送エンジンの宛先を検出すると、この機能は自動ファブリック接続の復元を試みます。
復元に失敗した場合、システムはインターフェイスをオフにしてブラックホーリングを制限し、到達できないパケット転送エンジンの宛先を示すアラームをトリガーします。ただし、インターフェイスをオフにする代わりに、[set chassis fabric event]
階層レベルで ステートメントを使用してset chassis fabric event reachability-fault actions recovery-failure pfe-offline
パケット転送エンジンオフラインに設定できます。
パケット転送エンジン の宛先は、次の理由で到達不能になることがあります。
完全なセルフブラックホール - すべてのファブリックプレーンで完全な接続損失が発生します。
完全なピアブラックホール- 2つのパケット転送エンジンはファブリックに到達できますが、互いに到達することはできません。
[edit chassis fabric event reachability-fault]
階層レベルで ステートメントを使用することで、ルーターがファブリック帯域幅の劣化を検出したときに、ファブリックリカバリーをトリガーするようにルーターを設定できますdegraded
。劣化ステートメントは、1 から 99 の範囲のパーセント値で設定されます。パーセント値はファブリック帯域幅劣化のエラーしきい値を表し、しきい値に達するとルーターは回復を開始します。
劣化エラーのしきい値が設定されている場合、ルーターは以下の理由でファブリックの回復を試みることもできます。
自己劣化 - パケット転送エンジンの宛先で劣化したファブリックの状態。
ピア劣化 - 2 つのパケット転送エンジン間の劣化したファブリックの状態。
ファブリックのリカバリー・プロセスには、以下の1つ以上のフェーズが含まれます。
SIB再起動フェーズ:複数のラインカードにわたるパケット転送エンジンの宛先でプレーンにファブリック接続障害が発生した場合、ルーターはSIBを再起動することで問題の解決を試みます。複数の SIB で再起動が必要な場合、ルーターは SIB を 1 つずつ再起動します。
FPC再起動フェーズ:ルーターは、次のシナリオでFPCを再起動することで自動回復を試みます。
完全または部分的なブラックホール状態を持つすべてのパケット転送エンジンの宛先は、単一のFPC内にあります。
完全または部分的なブラックホール状態を持つパケット転送エンジンの宛先が異なるFPC間で発生するが、どのパケット転送エンジンも共通の障害面を共有していない場合。
SIB 再起動フェーズの試行では、パケット転送エンジンの回復に失敗しました。
FPCの再起動を無効にして、劣化したファブリック状態からの回復アクションを制限できます。FPCの再起動を無効にするには、
[set chassis fabric event]
階層レベルでset chassis fabric event reachability-fault actions fpc-restart-disable
ステートメントを使用します。パケット転送エンジンオフラインフェーズ:以前の回復フェーズの試行が失敗したか、回復アクションが設定で無効になっているため、ルーターはインターフェイスをオフにして、デフォルトでブラックホール化を制限します。ただし、インターフェイスをオフにする代わりに、
[set chassis fabric event]
階層レベルで ステートメントを使用してset chassis fabric event reachability-fault actions recovery-failure pfe-offline
パケット転送エンジンオフラインに設定できます。
ルーターにピアブラックホールまたはピア劣化状態のパケット転送エンジンのみがある場合、ルーターはプレーン上のファブリックリンクを再起動することで、リンクの自動修復による回復を試みます。
利点
自動リカバリープロセスを試行して、劣化したファブリック状態からパケット転送エンジンを回復し、トラフィックの損失を最小限に抑えます。
復旧に失敗した場合、到達できないパケット転送エンジンの宛先を示す障害情報を提供するアラームを発生させます。
劣化したファブリック状態からの回復アクションを制限するために、ラインカード再起動を無効にする
ラインカードの再起動を無効にして、劣化したファブリック状態からの回復アクションを制限できます。T640およびT1600ルーターでは、ファブリックプレーンのみが再起動されます。PTXシリーズルーターでは、スイッチインターフェイスボード(SIB)のみが再起動されます。ラインカードの再起動を無効にするには、[edit chassis fabric degraded]
階層レベルで action-fpc-restart-disable
ステートメントを使用します。
[edit chassis fabric] degraded
ラインカードの再起動を無効にすると、ルーターに到達できない宛先が存在する場合にアラームが発生するため、ラインカードを手動で再起動する必要があります。
リカバリプロセス中にファブリックプレーン(T640およびT1600ルーター)またはSIB(PTXシリーズルーター)とラインカードの両方が再起動されるようにするには、[edit chassis fabric degraded]
階層レベルでaction-fpc-restart-disable
ステートメントを設定しないでください。
ファブリック帯域幅が低下したFPCの無効化
ファブリック帯域幅が低下したFPCをオフラインにして、シャーシで長時間Nullルートが発生するのを防ぐことができます。帯域幅が劣化したFPCを無効にするオプションを設定するには、[edit chassis fpc slot-number]
階層レベルでoffline-on-fabric-bandwidth-reduction
ステートメントを使用します。
[edit chassis] fpc slot-number { offine-on-fabric-bandwidth-reduction; }
ファブリック マネージャは、現在アクティブなプレーンの数を定期的にチェックします。アクティブ プレーンの数が特定のルータに必要なアクティブ プレーン数よりも少ない場合、システムは 10 秒間待機してから修正措置を講じます。FPCで帯域幅の減少状態が続き、FPCにこの機能が設定されている場合、システムはFPCをオフラインにします。
ファブリックOAMによるエラー処理
OAM(ファブリックの運用、管理、保守)は、ファブリック・パスの障害を検出するのに役立ちます。ファブリックOAMは、PFE用に新しいファブリック・パスが立ち上がるたびに、ファブリック・プレーンにトラフィックを送信する前にファブリック接続を検証します。障害が検出された場合、ソフトウェアは障害を報告し、そのPFEにそのファブリックプレーンを使用しないようにします。この機能は、利用可能な各ファブリック プレーン上で非常に低い PPS(パケット/秒)の自己宛先 OAM トラフィックを送信し、エンドポイントでのトラフィックの損失を検出することで機能します(ファブリック self-ping チェック)。
- Junos OS Evolvedリリース20.4R1では、ファブリックOAM機能がデフォルトで有効になっています。この機能を無効にするには、CLI コマンド
set chassis fabric oam detection-disable
を使用します。 - Junos OS Evolvedリリース20.4R2および21.1R1では、ファブリックOAM機能はデフォルトで無効になっています。
- Junos OS Evolvedリリース22.1R1では、ランタイムファブリックOAM機能がデフォルトで有効になっています。CLIコマンド
edit chassis fabric oam runtime-disable
を使用して、この機能を無効にすることができます。ランタイムファブリック OAM 機能は、PTX10004、PTX10008、PTX10016 ルーターでサポートされています。
ファブリックOAMチェックはブート時に実行されます。障害パスは無効になります。システムはリカバリー処置を行いません。ただし、SIB を再起動することで、影響を受けたファブリックプレーンの回復を試みることができます。回復手順は、障害の性質によって異なります。
ファブリックプレーンは、PFEとファブリックASICの間の独立した双方向パスを表します。Runtime Fabric OAM は、ファブリック接続を定期的にチェックし、システム実行時のファブリックプレーンの障害を検出して報告するのに役立ちます。ランタイムファブリック OAM は、各 PFE のファブリックの到達可能性を検出します。
単一または複数のFPCで同じファブリックプレーンに障害が発生した場合、次のコマンドを使用して、障害が発生したプレーンを含むSIBを再起動します。
user@host> request chassis sib slot slot-number offline
user@host> request chassis sib slot slot-number online
複数のFPCでランダムなファブリックプレーンに障害が発生した場合、障害を特定のFPCまたはSIBに分離することはできません。ただし、影響を受けるプレーンを含む SIB を順次再起動することで、プレーンの回復を試みることができます。
ファブリックOAM機能によって検出されたエラーごとに、syslogが生成されます。次に例を示します。
Oct 29 23:02:46 router-dvi resiliencyd[12921]: Error: /fpc/0/fabspoked-pfe/0/cm/0/pfe/0/fabric_link_foam_fault (0x410009), scope: board, category: internal, severity: major, module: fab-pfe@0, type: fabric link foam fault
次のsyslogメッセージは、ファブリックOAM関連のエラーがクリアされたことを示しています。
Oct 29 23:25:14 router-dvi resiliencyd[12921]: Performing action clear-cmalarm for error /fpc/0/fabspoked-pfe/0/cm/0/pfe/0/fabric_link_foam_fault (0x410009) in module: fab-pfe@0 with scope: board category: internal level: major
また、CLIコマンド show system errors active detail
および show system alarms
を使用して、ファブリックOAM関連のエラーを表示することもできます。
user@router> show system alarms
20 alarms currently active
Alarm time Class Description
2020-08-20 10:32:02 UTC Major FPC 0 Ideeprom read failure
2020-08-20 10:58:07 UTC Major FPC 0 Self_FOAM fault detected
[...Output truncated...]
user@router> show system alarms
14 alarms currently active
Alarm time Class Description
2022-02-15 23:45:28 PST Minor FPC 1 Volt Sensor Fail
2022-02-16 00:02:03 PST Major FPC 1 Self_Fabric OAM Runtime fault detected
2022-02-15 23:43:04 PST Minor FPC 1 Secure boot disabled or not enforced
2022-02-15 23:55:50 PST Minor FPC 3 Secure boot disabled or not enforced
[...Output truncated...]
次の出力は、単一のファブリックプレーンの障害(パケット転送エンジン0)とすべてのファブリックプレーンの障害(パケット転送エンジン1)の両方の詳細を示しています。
user@router> show system errors active detail
System Active Errors Detail Information
FPC 0
----------------------------------------------------------------
Error Name : fabric_down_condition_on_pfe
Identifier : /fpc/0/fabricHub/0/cm/0/fabrichub/1/fabric_down_condition_on_pfe
Description : fabric_down_condition_on_pfe
State : enabled
Scope : pfe
Category : functional
Level : major
Threshold : 1
Error limit : 0
Occur count : 3
Clear count : 2
Last occurred(ms ago) : 103158
System Active Errors Detail Information
FPC 0
----------------------------------------------------------------
Error Name : fabric_link_foam_fault
Identifier : /fpc/0/fabspoked-pfe/0/cm/0/pfe/0/fabric_link_foam_fault
Description : fabric link foam fault
State : enabled
Scope : board
Category : internal
Level : major
Threshold : 1
Error limit : 100
Occur count : 2
Clear count : 0
Last occurred(ms ago) : 113277
System Active Errors Detail Information
FPC 0
----------------------------------------------------------------
Error Name : fabric_link_foam_fault
Identifier : /fpc/0/fabspoked-pfe/0/cm/0/pfe/1/fabric_link_foam_fault
Description : fabric link foam fault
State : enabled
Scope : board
Category : internal
Level : major
Threshold : 1
Error limit : 100
Occur count : 12
Clear count : 0
Last occurred(ms ago) : 103267
System Active Errors Detail Information
RE 0
----------------------------------------------------------------
Error Name : fpga_min_supported_fw_ver_mismatch
Identifier : /re/0/hwdre/0/cm/0/fpga_fw_events/UBAM FPGA/fpga_min_supported_fw_ver_mismatch
Description : firmware_version_lower_than_minimum_expected
State : enabled
Scope : board
Category : functional
Level : minor
Threshold : 10
Error limit : 1
Occur count : 1
Clear count : 0
Last occurred(ms ago) : 68886367
FPC 1
----------------------------------------------------------------
Error Name : fabric_link_self_fabric_oam_runtime_fault
Identifier : /fpc/1/fabspoked-pfe/0/cm/0/pfe/0/fabric_link_self_fabric_oam_runtime_fault
Description : fabric link self fabric oam runtime fault
State : enabled
Scope : board
Category : internal
Level : major
Threshold : 1
Error limit : 36
Occur count : 1
Clear count : 0
Last occurred(ms ago) : 2022-02-16 00:02:03 PST (448108 ms ago) System Active Errors Detail Information
CLIコマンド show chassis fabric fpcs
を使用して、各ファブリック・プレーンのファブリックOAM self-ping状態を表示できます。
user@router> show chassis fabric fpcs
Fabric management FPC state:
FPC #0
PFE #0
SIB0_Asic0_Fcore0 (plane 0) Plane Disabled, Links ok Fabric OAM failed
SIB0_Asic0_Fcore0 (plane 1) Plane Enabled, Links ok Fabric OAM success
SIB0_Asic0_Fcore0 (plane 2) Plane Enabled, Links ok Fabric OAM success
SIB0_Asic0_Fcore0 (plane 3) Plane Enabled, Links ok Fabric OAM success
SIB0_Asic0_Fcore0 (plane 4) Plane Enabled, Links ok Fabric OAM success
SIB0_Asic0_Fcore0 (plane 5) Plane Enabled, Links ok Fabric OAM success
SIB1_Asic0_Fcore0 (plane 6) Plane Enabled, Links ok Fabric OAM success
SIB1_Asic0_Fcore0 (plane 7) Plane Enabled, Links ok Fabric OAM success
SIB1_Asic0_Fcore0 (plane 8) Plane Enabled, Links ok Fabric OAM success
SIB1_Asic0_Fcore0 (plane 9) Plane Enabled, Links ok Fabric OAM success
SIB1_Asic0_Fcore0 (plane 10) Plane Enabled, Links ok Fabric OAM success
SIB1_Asic0_Fcore0 (plane 11) Plane Enabled, Links ok Fabric OAM success
PFE #1
SIB0_Asic0_Fcore0 (plane 0) Plane Enabled, Links ok Fabric OAM success
SIB0_Asic0_Fcore0 (plane 1) Plane Enabled, Links ok Fabric OAM success
user@router> show chassis fabric fpcs Fabric management FPC state: FPC #1 PFE #0 SIB0_Asic0_Fcore0 (plane 0) Plane Enabled, Links ok Fabric OAM Runtime success SIB0_Asic0_Fcore0 (plane 1) Plane Disabled, Links ok Fabric OAM Runtime failed SIB0_Asic1_Fcore0 (plane 2) Plane Enabled, Links ok Fabric OAM Runtime success SIB0_Asic1_Fcore0 (plane 3) Plane Enabled, Links ok Fabric OAM Runtime success SIB0_Asic2_Fcore0 (plane 4) Plane Enabled, Links ok Fabric OAM Runtime success SIB0_Asic2_Fcore0 (plane 5) Plane Enabled, Links ok Fabric OAM Runtime success SIB1_Asic0_Fcore0 (plane 6) Plane Enabled, Links ok Fabric OAM Runtime success SIB1_Asic0_Fcore0 (plane 7) Plane Enabled, Links ok Fabric OAM Runtime success SIB1_Asic1_Fcore0 (plane 8) Plane Enabled, Links ok Fabric OAM Runtime success SIB1_Asic1_Fcore0 (plane 9) Plane Enabled, Links ok Fabric OAM Runtime success SIB1_Asic2_Fcore0 (plane 10) Plane Enabled, Links ok Fabric OAM Runtime success SIB1_Asic2_Fcore0 (plane 11) Plane Enabled, Links ok Fabric OAM Runtime success SIB2_Asic0_Fcore0 (plane 12) Plane Enabled, Links ok Fabric OAM Runtime success SIB2_Asic0_Fcore0 (plane 13) Plane Enabled, Links ok Fabric OAM Runtime success SIB2_Asic1_Fcore0 (plane 14) Plane Enabled, Links ok Fabric OAM Runtime success SIB2_Asic1_Fcore0 (plane 15) Plane Enabled, Links ok Fabric OAM Runtime success
ファブリックOAM機能が無効になっている場合、 show chassis fabric fpcs
コマンドは以下の出力を表示します。
user@router> show chassis fabric fpcs
Fabric management FPC state:
FPC #0
PFE #0
SIB0_Asic0_Fcore0 (plane 0) Plane Enabled, Links ok
SIB0_Asic0_Fcore0 (plane 1) Plane Enabled, Links ok
SIB0_Asic0_Fcore0 (plane 2) Plane Enabled, Links ok
SIB0_Asic0_Fcore0 (plane 3) Plane Enabled, Links ok
SIB0_Asic0_Fcore0 (plane 4) Plane Enabled, Links ok
SIB0_Asic0_Fcore0 (plane 5) Plane Enabled, Links ok
SIB1_Asic0_Fcore0 (plane 6) Plane Enabled, Links ok
SIB1_Asic0_Fcore0 (plane 7) Plane Enabled, Links ok
SIB1_Asic0_Fcore0 (plane 8) Plane Enabled, Links ok
SIB1_Asic0_Fcore0 (plane 9) Plane Enabled, Links ok
SIB1_Asic0_Fcore0 (plane 10) Plane Enabled, Links ok
SIB1_Asic0_Fcore0 (plane 11) Plane Enabled, Links ok
PFE #1
SIB0_Asic0_Fcore0 (plane 0) Plane Enabled, Links ok
SIB0_Asic0_Fcore0 (plane 1) Plane Enabled, Links ok
SIB0_Asic0_Fcore0 (plane 2) Plane Enabled, Links ok
SIB0_Asic0_Fcore0 (plane 3) Plane Enabled, Links ok
SIB0_Asic0_Fcore0 (plane 4) Plane Enabled, Links ok
SIB0_Asic0_Fcore0 (plane 5) Plane Enabled, Links ok
SIB1_Asic0_Fcore0 (plane 6) Plane Enabled, Links ok
SIB1_Asic0_Fcore0 (plane 7) Plane Enabled, Links ok
SIB1_Asic0_Fcore0 (plane 8) Plane Enabled, Links ok
SIB1_Asic0_Fcore0 (plane 9) Plane Enabled, Links ok
SIB1_Asic0_Fcore0 (plane 10) Plane Enabled, Links ok
SIB1_Asic0_Fcore0 (plane 11) Plane Enabled, Links ok
PFE #2
SIB0_Asic0_Fcore0 (plane 0) Plane Enabled, Links ok
SIB0_Asic0_Fcore0 (plane 1) Plane Enabled, Links ok
SIB0_Asic0_Fcore0 (plane 2) Plane Enabled, Links ok
SIB0_Asic0_Fcore0 (plane 3) Plane Enabled, Links ok
SIB0_Asic0_Fcore0 (plane 4) Plane Enabled, Links ok
SIB0_Asic0_Fcore0 (plane 5) Plane Enabled, Links ok
SIB1_Asic0_Fcore0 (plane 6) Plane Enabled, Links ok
SIB1_Asic0_Fcore0 (plane 7) Plane Enabled, Links ok
SIB1_Asic0_Fcore0 (plane 8) Plane Enabled, Links ok
SIB1_Asic0_Fcore0 (plane 9) Plane Enabled, Links ok
SIB1_Asic0_Fcore0 (plane 10) Plane Enabled, Links ok
SIB1_Asic0_Fcore0 (plane 11) Plane Enabled, Links ok
PFE #3
変更履歴
サポートされる機能は、使用しているプラットフォームとリリースによって決まります。特定の機能がお使いのプラットフォームでサポートされているかどうかを確認するには、 Feature Explorer を使用します。