Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

AIのユースケースとリファレンスデザイン

AI JVDリファレンスデザインは、フロントエンドファブリック、GPUバックエンドファブリック、ストレージバックエンドファブリックを含む、エンドツーエンドのイーサネットベースのAIインフラストラクチャを完全にカバーしています。これら3つのファブリックは共生関係にあり、それぞれがAIトレーニングと推論タスクをサポートする独自の機能を提供します。AIファブリックでイーサネットネットネットワークを使用することで、お客様はジョブ完了までにかかる時間を最短化し、GPUの利用を最大化しながら、限られたITリソースで大容量で操作が容易なネットワークファブリックを構築できます。

#Toc171952248__Ref171928222に示したAI JVDリファレンスデザインには、以下が含まれています。

  • フロントエンドファブリック:このファブリックは、ヘッドエンドサーバーに存在するAIツールからGPUノードとストレージノードへのゲートウェイネットワークです。フロントエンドGPUファブリックを使用すると、ユーザーはGPUおよびストレージノードを操作して、トレーニングまたは推論ワークロードを開始し、その進行状況と結果を視覚化できます。また、NCCL(NVIDIA Collective Communications Library)の集団通信のための帯域外パスも提供します。
  • GPUバックエンドファブリック:GPUノード(AIワークフローの計算タスクを実行する)を接続するファブリックです。GPUバックエンドファブリックは、トレーニングジョブ中にGPU間で高速情報をロスレス方式で転送します。GPUによって生成されたトラフィックは、RoCEv2(RDMA over Ethernet v2)を使用して転送されます。
  • ストレージバックエンドファブリック: このファブリックは、高可用性ストレージシステム(大規模モデルのトレーニングデータを保持する)とGPU(トレーニングジョブまたは推論ジョブ中にこのデータを消費する)を接続します。ストレージバックエンドファブリックは、シームレスかつ信頼性の高い方法で大量のデータを転送します。

図1:AI JVDリファレンスデザイン