ブラックホールの検出
このトピックでは、Routing Director がブラックホールに関する通知と、ブラックホール イベントの根本原因分析のための情報を提供する方法について説明します。
トラフィックブラックホールは、トランジットトラフィックが一貫してまたは断続的にドロップされる場合に発生します。ブラックホールは次の原因で発生します。
- ハードウェア エラー(インターフェイス、ファブリック、キューイング ドロップ カウンター)
- ソフトウェアの問題
- BFDセッションフラップ、リンクフラップ、ラインカード再起動、GRES、NSR、設定変更などのイベントの副作用
- リソースの枯渇
- 誤った設定
Juniper Routing Directorがブラックホールを検知し、ブラックホールが検出されるとアラートを表示します。ブラックホールを検出するには、Routing Directorでブラックホール検出を有効にする必要があります。
以下のコマンドを使用して、ルーティングディレクターでブラックホール検出を設定します。
Routing Directorがブラックホールを検出して表示するには、Routing Directorのインストールで以下のコマンドを設定する必要があります。
set deployment cluster applications aiops install-aiml true set deployment cluster applications aiops enable-blackhole true
詳細については、「 クラスターのデプロイ 」を参照してください。
ルーティングディレクターでブラックホール検出を有効にすると、ブラックホールを検出するためのKPI(パケットドロップ、ソフトウェアエラー、ハードウェア割り込み)を収集するためのプレイブックルールがデバイスに適用されます。
AI/MLを有効にするには、追加のシステムリソース(CPUとメモリ)が必要になります。AI/MLに必要なその他のリソースについては、 ハードウェア要件を参照してください。
Routing Directorは、AI/MLを使用して、Routing Directorにオンボーディングされたデバイスのブラックホールを検出します。Routing Directorでブラックホール検出が有効になっている場合、センサーは入力パケットレート、出力パケットレート、パケットドロップレートをキャプチャするように初期化されます。キャプチャされたレートをそれぞれのしきい値と比較すると、パケット ドロップ レートのしきい値が持続的に破られる場合はブラックホールが検出されます。
ブラックホールの詳細を表示
Routing Directorは、一定期間にドロップされたパケット数の変化に基づいてブラックホールを識別します。ドロップされたパケットの数が指定されたしきい値を超えた場合、ルーティングディレクターはブラックホールを示すクリティカルアラームを生成します。この情報は、[Alerts] テーブル([Observability > Events] > [Alerts] タブ)および [ Device-Name ] ページの [Routing and MPLS] アコーディオンに [Traffic Loss] として表示されます。[ Device-Name ] ページにアクセスするには、[ Observability > Health > Troubleshoot Devices > Device-Name > Overview > Routing and MPLS accordion ] をクリックし>[Traffic Loss Alert] リンクをクリックします。
図 1 は、ルーティングと MPLS のアコーディオンに表示された 「Blackhole Detected 」アラートを示しています。
[ アラート(Alerts )] リンクをクリックすると、[トラフィックの損失(Traffic Loss)] ページにアラートの詳細が表示されます。アラートは、次のような表に一覧表示されます
-
ブラックホールが検出されたことを示す赤色の警告アイコン(クリティカル)
-
オレンジ色の警告アイコン(メジャー)は、パケットドロップの異常はあるが、ブラックホールは確認されていないことを示します。
-
ブラックホールが検出されず、パケットドロップ異常が存在しないことを示す、正常で小さな円のアイコン。
[トラフィックの損失(Traffic Loss)] ページの詳細については、 トラフィックの損失を参照してください。