デバイステレメトリサービス
概要 Apstraには、デバイスが接続されたときに自動的に収集されるテレメトリサービスが組み込まれています。また、独自のテレメトリサービスを開発することもできます。
デバイステレメトリの表示
異常
これらのテレメトリ サービスに異常 (赤で表示) がある場合は、[ 異常 ] タブで集計されます。ここでは、デバイスのすべてのテレメトリ異常の概要を確認できます(または、特定のサービス異常の個々のサービスタブで確認できます)。
テレメトリサービス
サービス | 概要 |
---|---|
ARP | ARP テレメトリは、ARP テーブルを示しています。この情報はAPI経由で照会できます。異常は生成されません。 |
BGP | BGP テレメトリは、ロール、VRF 名、アドレス ファミリー、送信元と宛先の情報、予想される状態と実際の状態、インテント ステータス、最終取得/変更、BGPピアの状態を示します。 |
設定 | これが実行中のコンフィグです レンダリングされた検出済み/サービス設定と実際の設定の間に偏差があるデバイスには、設定偏差エラーのフラグが付けられます。Apstraの管理外で設定変更が行われると、直ちにアラームが生成されます。設定の逸脱によるリスクは、Apstraが設定の書き換えで逸脱した設定を上書きする可能性があることです。 設定逸脱アラームに対処する正しい方法は、行われている設定変更を理解し、代わりに コンフィグレット として設定することを検討することです。 |
カウンター | カウンターテレメトリは、インターフェイスの入出力パケット、インターフェイスエラー、統計情報などの情報を提供します。この機能は、テレメトリ ストリーミングなどの他の高度なダウンストリーム機能によって使用されます。異常は生成されません。 |
ホスト名 | 展開モードが [準備完了] のデバイスをブループリントに割り当てると、デバイスは 準備完了 ステージ (以前は検出 2 と呼ばれていました) に入ります。インテントに照らしてデバイスのホスト名を検証するホスト名テレメトリが収集されます。不一致は異常につながります。 |
インターフェイス | 展開モードが [準備完了] のデバイスをブループリントに割り当てると、デバイスは 準備完了 ステージ (以前は検出 2 と呼ばれていました) に入ります。インテントと物理インターフェイスのアップ/ダウン状態を比較するインターフェイステレメトリが収集されます。LLDP、LAG、またはその他の添付ファイル情報は含まれません。 |
遅れ | LAGテレメトリは、サーバーとMLAGスイッチ間のすべてのLACPボンディングの状態を示します。 |
LLDP(ケーブル) | 展開モードが [準備完了] のデバイスをブループリントに割り当てると、デバイスは 準備完了 ステージ (以前は検出 2 と呼ばれていました) に入ります。すべてのノードがインテントの一部です。各リンクには、想定されるネイバーホスト名、インターフェイス、および接続があります。物理的なケーブル配線とリンクは、指定されたインテントに一致する必要があります。逸脱は異常をもたらすため、設計図に一致するようにケーブルを再配線するか、すでに設置されているケーブル配線と一致するように設計図を変更して修正する必要があります。 |
Mac | MAC アドレス テーブル テレメトリは、どの MAC アドレスがどのインターフェイスとどの VLAN に表示されるかを示します。 |
MLAG社 | MLAGテレメトリは、MLAGドメイン自体の健全性ステータス(MLAGドメインの状態を確認するために、2つのリーフスイッチが互いに適切に通信するために必要な制御プロトコル)を追跡します。実装の詳細 複数のベンダー間に違いがありますが、意図は同じです。スイッチは互いに健全でなければなりません。MLAGテレメトリは、MLAGペアに少なくとも1つの仮想ネットワークが割り当てられているL2ブループリントでのみ使用できます。 MLAGで接続されたサーバーが完全に接続されていない場合、状態は「active_full」から「active_partial」に変わります。
手記:
Cisco MLAG(VPC)コマンドは、VPCピアスイッチ上のLAGのステータスを取得できません。したがって、 状態 dual-active は実際にコマンドを収集できません。これはシスコの制限です。 |
ルート | ルーティングテレメトリは、すべての管理対象スパインとリーフのルーティングテーブルを分析します。IPファブリック全体が管理されるため、ネットワークトポロジーから完全なIPテーブル情報を導き出し、予測することができます。ネットワーク ルーティング テレメトリの偏差(デフォルト ルートのネクストホップ IP アドレスの欠落など)は、アラームの原因となります。 |
トランシーバー | トランシーバ テレメトリは、DOM 統計、光レベル、損失の多いインターフェイス、およびその他の光統計情報を示し、ネットワーク オペレータに光インターフェイスに関する統計情報を提供します。異常は生成されません。 |
使用率(オンボックスエージェントのみ) | 利用状況テレメトリにより、ネットワーク運用担当者は、CPUとメモリの使用率など、デバイスに関する重要な統計情報を表示することができます。異常は生成されません。 利用状況のテレメトリは、オフボックスエージェントを使用しているデバイス(Junosなど)では利用できません。したがって、[使用率]タブには「 ネットワークデバイスが見つかりません」というエラーが表示されます。 |
追加のテレメトリを収集できます | 詳細については、 Extensible Telemetry Guide を参照してください。 |
収集統計
[ 収集統計 ] タブをクリックすると、サービスのテレメトリの収集方法の詳細が表示されます。詳細については、以下の表を参照してください。
収集統計の説明 | |
---|---|
サービス名 | サービスの名前 |
コレクション型 | ポーリングまたは gRPC |
サービスは開始されましたか? | サービスは開始されましたか? |
間 | デバイス上でサービスを実行するように構成される頻度 (秒単位) |
インプット | 処理のためにサービスに提供される入力 |
実行回数 | コレクターの実行がスケジュールされている回数 |
成功回数 | コレクターが正常に実行された回数 |
失敗回数 | コレクターが実行に失敗した回数 |
タイムアウト カウント | コレクターがタイムアウトした回数 |
最大実行回数(Max Run Count) | コレクターがユーザーが指定した最大実行回数 |
実行時間 | 最後の反復で収集にかかった時間 (ミリ秒単位) |
待ち時間 | デバイスは複数のコレクターを実行します。一部のコレクタがCPUを独占すると、他のコレクタの実行は延期されます。待機時間は、コレクターが遅延された時間(ミリ秒単位)です。 |
最終実行タイムスタンプ | コレクターの実行がスケジュールされたタイムスタンプ |
最終エラーのタイムスタンプ | コレクターが最後にエラーを報告したタイムスタンプ |
エラー メッセージ | 最後のコレクター反復からのエラーメッセージ。 |