Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

テレメトリと監視

AIクラスターネットワークは、ロスレスで高スループット、低遅延の接続を必要とします。パフォーマンスを維持するための重要な要素は、輻輳、システムの健全性、トラフィックパターンを監視するための運用データの収集と分析です。Junos OSテレメトリにより、AIワークロードに固有のしきい値、カウンター、混雑メトリックなど、重要なパフォーマンス指標を詳細に追跡できます。収集したデータは、監視、意思決定、継続的なネットワーク最適化をサポートするために、分析、構造化、可視化する必要があります。

以下のセクションでは、データ収集を有効にするためのデバイスの設定方法と、AI EVPN/VXLANファブリックソリューションに推奨される主要なパフォーマンス指標について概説します。

テレメトリ情報を提供する QFX スイッチの構成

テレメトリ収集を実装するには、Junos Telemetry Interface ユーザー ガイドの「 Junos Telemetry Interface の OpenConfig および gRPC 」セクションの説明に従って、gPRC ベースのアクセスを許可するようにスイッチを構成する必要があります。

この目的のために、すべてのリーフおよびスパインノードデバイスで次の設定が使用されました。

表 49.Junos OS 用 gRPC 設定コマンド

コマンド の説明
extension-service request-response grpc Junos Telemetry Interface (JTI) やサードパーティ統合などの API に使用される、拡張サービス フレームワークの下で gRPC インターフェイスを有効にします。クライアントはリクエストを発行し、Junos OSサーバーからの応答を待ちます。
ssl port 32767 SSL暗号を使用した通信用にTCPポート32767を構成します。
local-certificate aos_grpc aos_grpc という名前の証明書を使用して認証を構成し、gRPC セッションをセキュリティで保護します。 「gRPC サービスの構成 」で説明されている手順に従って、必要な証明書を生成してインストールします。
routing-instance mgmt_junos gRPC サーバーをmgmt_junosルーティング インスタンスにバインドします。つまり、アウトオブバンド管理インターフェイスでのみリッスンします。

テレメトリ コレクター間の接続を検証するには、 show system connections コマンドを使用して、構成されている ssl ポート番号を検索します。

サンプル出力は、2つのコレクター(10.100.1.17および10.100.1.20)からの接続を示しています。

コレクターが gRPC/gNMI を介してアクティブにデータを取得していることを確認し、 どのセンサーが使用されているか を確認するには、以下を使用します。

  • show network-agent statistics
  • show network-agent statistics detail
  • show network-agent statistics subscription-paths <sensor-path>
  • show network-agent statistics juniper
  • show network-agent statistics gnmi

:

センサーのステータスを確認するには、以下を使用できます。 show agents sensors