AI-MLデータセンターのロードバランシングの概要
AI-MLデータセンターが大規模なデータフロー(エレファントフローとも呼ばれる)を処理する場合、ロードバランシングに大きな課題が生じます。大量のデータフローがネットワーク全体で適切に負荷分散されないと、トラフィックの輻輳が発生する可能性があります。トラフィックの輻輳が発生した場合、効果のないロードバランシングは、すでに輻輳しているリンクにトラフィックを誤って誘導し、問題を悪化させる可能性があります。Junos OS Evolvedは、大規模なデータフローの課題に合わせて最適化された、いくつかのタイプのロードバランシング構成を提供します。
ネットワーク管理者は、主に次の 3 種類のロード バランシングを設定できます。
スタティック ロード バランシング(SLB):SLB では、特定のタイプのトラフィックが常に特定のリンクを使用するように設定します。SLB は、ロード バランシングの最も基本的なタイプです。SLBはリアルタイムのリンク条件に対応できないため、AI-MLデータセンターファブリックには理想的ではありません。
動的ロードバランシング(DLB):DLBは、トラフィックキューのサイズとローカルリンク帯域幅の使用率に基づいて、トラフィックフローのリンクを動的に選択します。DLB は、トラフィックを再ルーティングする前に、リンクの状態もチェックします。DLBはSLBよりも交通渋滞を回避するのに効果的です。
DLBには、カスタマイズを可能にするいくつかのモードとタイプがあります。
選択的 DLB - 特定のパケットごとのシナリオでは DLB を選択的に有効にし、その他のシナリオでは SLB を使用します。
リアクティブパスの再調整- フローレットモード が有効になっている場合でも、DLBに対するこの拡張機能を使用して、トラフィックをより高品質のリンクに移動します。
グローバルロードバランシング(GLB):GLBはDLBを改良したものです。DLBではローカルリンクの帯域幅使用率のみが考慮されますが、GLBではネクストツーネクストホップ(NNH)レベルでリンクの帯域幅使用率を可視化できます。GLBはトラフィックフローを再ルーティングして、DLBが検出できるものよりもネットワーク内で遠く離れたトラフィック輻輳を回避できます。
これらのさまざまなロードバランシング技術は、AI-MLデータセンターファブリック内で並行して使用できます。各タイプのロードバランシングについて詳細をご確認ください。