AI-MLデータセンターの負荷分散の概要
AI-MLデータセンターがエレファントフローを処理する場合、ロードバランシングに関する重大な課題が発生します。エレファントフローがネットワーク全体で適切にロードバランシングされていない場合、トラフィックの輻輳が発生する可能性があります。トラフィック輻輳が発生すると、効果のないロードバランシングによって、すでに混雑しているリンクにトラフィックが誤って誘導され、問題がさらに悪化する可能性があります。Junos OS Evolvedは、エレファントフローの課題に対して最適化されたいくつかのタイプのロードバランシング設定を提供します。
ネットワーク管理者は、ネットワーク上で 3 つの主要なタイプのロードバランシングを構成できます。
静的ロードバランシング(SLB)—SLBでは、常に特定のリンクを使用するように特定のタイプのトラフィックを設定します。SLB は、最も基本的なタイプのロードバランシングです。
ダイナミックロードバランシング(DLB)—DLBは、トラフィックキューのサイズとローカルリンク帯域幅の使用率に基づいて、トラフィックフローのリンクを動的に選択します。DLBは、トラフィックを再ルーティングする前に、リンクの状態もチェックします。DLBは、SLBよりもトラフィックの輻輳を回避するのに効果的です。
DLBには、カスタマイズが可能ないくつかのモードとタイプがあります。
-
選択的 DLB—特定のパケットごとのシナリオで DLB を選択的に有効にし、他のシナリオで SLB を使用します。
-
フローレット モード: フローレット モードでは、DLB は非アクティブ タイマーを使用してフローのステータスを追跡します。特定のフローの非アクティブ タイマーが期限切れになると、DLB は、そのリンクがそのフローに対して引き続き最適であるかどうかを再確認します。リンクが最適でなくなった場合、DLBは新しいエグレスリンクを選択します。
-
リアクティブ パス リバランス — DLB のこの機能拡張を使用して、 フローレット モード が有効になっている場合でも、トラフィックをより高品質のリンクに移動できます。
-
グローバルロードバランシング(GLB):GLBはDLBを改良したものです。DLBが考慮するのはローカルリンクの帯域幅利用率のみであるのに対し、GLBはネクストツーネクストホップ(NNH)レベルでリンクの帯域幅利用状況を可視化することができます。GLBはトラフィックフローを再ルーティングすることで、DLBが検知できる範囲よりもネットワークの奥深くでトラフィックの輻輳を回避することができます。
これらの異なるロードバランシング手法は、AI-MLデータセンターファブリック内で並行して使用できます。