Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

RDMA フローのキューペアハッシュ

概要

ロードバランシングアルゴリズムは、ハッシュメカニズムを使用して、リンクアグリゲーショングループ(LAG)またはECMPバンドルから最適な発信インターフェイスを選択します。ほとんどのロードバランシング アルゴリズムは、5 タプル情報に基づいてハッシュ(つまり、リンク間でトラフィックの負荷を分割)します。5タプル情報は、送信元と宛先のMACアドレスを含むレイヤー2(L2)をカバーしています。送信元と宛先のIPアドレスを含むレイヤー3(L3)。TCP/UDPポートを含むレイヤー4(L4)。しかし、AI-ML学習ネットワークでは、ほとんどのトラフィックのトランスポートにRDMA(Remote Direct Memory Access)over Converged Ethernet version 2(RoCEv2)が使用されています。ROCEv2トラフィックは、L4ポートで差がない可能性があります。これにより、エントロピーが低下し、ロードバランシングの効率が低下する可能性があります。

アプリケーション トラフィックのトランスポートに RoCEv2 を使用するネットワークでは、RDMA 接続は送信キューでトラフィックを送信し、受信キューでトラフィックを受信します。これらのキューは、RDMA 接続を形成します。送信キューと受信キューを合わせて、キュー ペアと呼びます。各キュー ペアには、識別可能なプレフィックスがあります。ROCEv2 では、宛先キュー ペアをフロー識別フィールドとして使用します。

ハッシュ計算に宛先キューペアを含めることで、AI-MLトレーニングネットワークのロードバランシングを強化できます。これは、キューペアハッシュと呼ばれます。ハッシュ計算に宛先キュー ペアを追加すると、システムのエントロピーが増加し、全体的なロードバランシング効率が向上します。この機能をサポートするデバイスとリリースでは、すべてのROCEv2トラフィックに対してキューペアハッシュがデフォルトで有効になっています。

手記:

デバイスで動的ロードバランシング(DLB)を有効にすると、キューペアハッシュはリンクアグリゲーショングループ(LAG)インターフェイスで自動的に無効になります。

構成

キューペアハッシュの検証

デフォルトでは、ロードバランシング・アルゴリズムは、RDMA トラフィック (IPv4 と IPv6 の両方) のハッシュ計算の一部として RDMA キュー・ペアを含みます。設定は必要ありません。

この機能が有効になっていることを確認するには、次のコマンドを使用して、出力の「RDMA Queue Pair」フィールドが「yes」とマークされていることを確認します。

キューペアハッシュを無効にする

ロードバランシングハッシュ計算からキューペアを除外するには、次のように設定します。

  1. show forwarding-options enhanced-hash-keyコマンドを使用して、デバイスに設定されているハッシュモードを確認します。
    この例では、ハッシュモードがデフォルトの layer2-payloadです。わかりやすくするために出力を短くしています。
  2. hash-mode ステートメントを使用してハッシュ モードを設定します。

    前のステップで示したように、この例ではデバイスがすでに layer2-payload をハッシュモードとして認識していますが、CLI で設定する必要があります。それ以外の場合、コミットは失敗します。

  3. IPv4 または IPv6 の no-queue-pair オプションを設定します。
  4. 設定をコミットします。

プラットフォームのサポート

プラットフォームとリリースのサポートについては 、Feature Explorer を参照してください。