Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

事後対応型パスリバランシング

概要

動的ロードバランシング(DLB)は、AI-MLデータセンターファブリックに内在する大規模なデータフロー(エレファントフローとも呼ばれる)を処理するための重要なツールです。 リアクティブ パス リバランシング は、既存の DLB 機能の拡張機能です。

DLB のフローレットモードでは、ネットワーク管理者が非アクティブ間隔を設定します。トラフィックは、フローが休止タイマーよりも長く一時停止するまで、割り当てられた発信(エグレス)インターフェイスを使用します。発信リンクの品質が徐々に低下する場合、フロー内の一時停止は、設定された非アクティブタイマーを超えない可能性があります。この場合、従来のフローレット モードではトラフィックが別のリンクに再割り当てされないため、トラフィックはより高品質のリンクを利用できません。リアクティブパスリバランシングは、フローレットモードが有効になっている場合でも、ユーザーがトラフィックをより高品質のリンクに移動できるようにすることで、この制限に対処します。

デバイスは、各 ECMP(Equal Cost Multipath)のエグレス メンバー リンクに、リンクを通過するトラフィックに基づいて、品質バンドを割り当てます。品質帯域は、ポート負荷とキューバッファに依存します。ポート負荷は、送信されたエグレスバイト数です。キューバッファは、エグレスポートからの送信を待機しているバイト数です。ECMP を通過するトラフィック パターンに基づいて、これらの属性をカスタマイズできます。

利点

  • リンク劣化に対するスケーラブルなソリューション

  • 大規模なデータフローにおける帯域幅の最適な利用

  • 長時間のフローによるロードバランシングの非効率性の回避

構成

構成の概要

品質バンドには 0 から 7 までの番号が付けられており、0 が最低品質、7 が最高品質です。DLB は、メンバー ポートの負荷とキュー サイズに基づいて、メンバー ポートに品質帯域値を割り当てます。ポートから品質へのバンド マッピングは、瞬間的なポート負荷とキュー サイズに基づいて変化します。

以下の両方の条件が満たされた場合、リアクティブ パス リバランスにより、フローをより品質の高いメンバー リンクに再割り当てできます。

  • 現在のメンバーの品質バンドに設定された再割り当て 品質デルタ 値を加えた値以上の品質バンドを持つ、より高品質のメンバーリンクが利用可能です。品質差分は、2 つの品質バンドの差です。 quality-delta ステートメントを使用して品質デルタ値を設定します。

  • システムが生成するパケットのランダム値が、再割り当て 確率のしきい値 よりも低い値です。 prob-threshold ステートメントを使用して確率しきい値を設定します。

この機能を使用する際は、以下の点に注意してください。

  • リアクティブ パス リバランスはグローバル設定であり、システム内のすべての ECMP DLB 設定に適用されます。

  • フローの再割り当てを制御するために、リアクティブパスリバランスに加えて、出力量子化を設定することができます。

  • パケットの並べ替えは、フローが 1 つのポートから別のポートに移動するときに発生する可能性があります。リアクティブ パス リバランスを設定すると、フローが新しいリンクに再割り当てされたときに、一時的に順序不同の問題が発生する可能性があります。

位相幾何学

このトポロジーでは、デバイスには3つの入力ポートと2つの出力ポートがあります。イングレス ストリームのうち 2 つはレイヤー 2(L2)トラフィックで、1 つはレイヤー 3(L3)トラフィックです。この図は、各エグレスポートにトラフィックを転送するテーブルエントリーを示しています。すべてのイングレスポートとエグレスポートは同じ速度です。

図 1: リアクティブ パス リバランス Reactive Path Rebalancing

このトポロジーでは、リアクティブパスリバランスは次のように機能します。

  1. 品質差分 2 が設定されています。

  2. L2 ストリーム 1(mac 0x123)は、10 % のレートでイングレス ポート et-0/0/0 に入ります。et-0/0/10から出ます。et-0/0/10のエグレスリンク利用率は10%で、品質帯域値は6です。

  3. L3 ストリームは、50 % のレートでポート et-0/0/1 に入ります。et-0/0/11から出て、ECMPメンバーリストから最適なリンクを選択します。et-0/0/11のエグレスリンク利用率は50%で、品質帯域値は5です。

  4. L2 ストリーム 2(mac 0x223)は、40 % のレートでポート et-0/0/2 に入ります。また、et-0/0/11から出ます。これにより、et-0/0/11 リンク品質帯域値がさらに 4 に低下します。これで、両方の ECMP メンバー リンクの品質帯域値の差は 2 になります。

  5. ポート et-0/0/10 と et-0/0/11 の品質帯域値の差が設定された品質デルタ 2 以上であるため、リアクティブ パス バランシング アルゴリズムが動作可能になります。このアルゴリズムは、L3 ストリームを et-0/0/11 からより品質の高いメンバー リンク(この場合は et-0/0/10)に移動します。

  6. L3 蒸気が et-0/0/10 に移動すると、et-0/0/10 リンク使用率は 60 % に増加し、品質帯域値は 5 に減少します。L2 ストリーム 2 は、引き続き et-0/0/11 を経由して送信されます。et-0/0/11 リンク使用率は 40% のままで、品質帯域値が 5 に増加しています。

リアクティブ パス リバランシングの設定

  1. DLB をフローレット モードで設定します。動的ロードバランシングの設定を参照してください。
  2. 現在のストリーム メンバーと再割り当て可能なメンバーの間で必要な品質の差分(差分)を構成します。

    品質デルタの最適な選択は非常に重要です。差分が正しくないと、あるリンクから別のリンクにフローが継続的に再割り当てされる可能性があります。

    quality-delta ステートメントの範囲は 0 から 8 です。フローの再割り当てを無効にするには、これを 0 に設定します。

  3. リアクティブパスリバランスが、既存のフローをより可用性の高いメンバーリンクに再割り当てするために使用する確率しきい値を設定します。

    確率のしきい値を設定する場合は、次の点に注意してください。

    • quality-deltaが設定されている場合、prob-thresholdデフォルトは100です。

    • prob-threshold の範囲は 0 から 255 です。フローの再割り当てを無効にするには、これを 0 に設定します。

    • 確率のしきい値が低いほど、フローはより遅い速度で高品質のメンバー リンクに移動します。例えば、フローは、確率しきい値が 50 の場合よりも、確率しきい値が 200 の場合の方が、より迅速に高品質のリンクに移動します。

  4. 設定が成功したことを確認します。

プラットフォームのサポート

プラットフォームとリリースのサポートについては 、Feature Explorer を参照してください。