AIデータ センターネットワーク

最近の生成人工知能(AI)の進歩は、世界中の何億人もの人々の想像力をかきたてており、企業はAIと機械学習(ML)に多大な関心を寄せています。データセンターはAIを支えるエンジンであり、データセンターネットワークは、AIトレーニングデータセンターで膨大な計算処理をおこなう高コストのGPUサーバーを相互接続して、利用率を最大限に活用する上で重要な役割を果たします。

AI/MLワークロード用に最適化されているデータセンターネットワークには、AIモデリングのパフォーマンスと経済性を最適化するために、混雑管理、ロードバランシングなどの特別な機能が必要です。ジュニパーのソリューションは、大容量で拡張性が高く、ノンブロッキングのネットワークファブリックでこれらの課題に対応し、最高のAIパフォーマンスを実現します。

Modern high rise building with sky view

AIの経済性を改善

AIトレーニングの経済性は、高速でシンプル、インテリジェントな高度なネットワークにかかっています。

詳細はこちら(英語)

ジュニパーがサポートします

ジュニパーは常にイノベーションで、規模、パフォーマンス、ユーザーエクスペリエンスを新たなレベルへと向上させています。ジュニパーのAIネットワーキングソリューションは、大容量で拡張性が高く、操作が容易なネットワークファブリックを構築するお客様をサポートし、GPUの利用率を最大限に高めて経済性を改善しながら、ジョブ完了までにかかる時間(JCT)を最短化します。

Technology iot concept.

高性能AIファブリック

AIモデルのトレーニングにおいては、GPUの使用率を最大化し、アイドル時間を最小限に抑えることが、重要な経済的要因となります。ジュニパーAIネットワーキングソリューションは、固定フォームファクタと高ラジックススイッチを組み合わせたもので、ジュニパーの幅広いシリコンポートフォリオと組み合わせることで、JCTを最適化してテール遅延を最小限に抑えることができます。このソリューションは、電力効率や規模などの要因に合わせて最適化されたユースケースに柔軟性を提供します。

Business intelligence analyst dashboard on virtual screen. Big data Graphs Charts.

オープンなスタンダードベースのソリューション

企業をロックインさせる独自のソリューションは、AIイノベーションを阻害する可能性があります。ジュニパーは、データセンターネットワークにおけるイーサネット標準を堅牢なベンダーエコシステムでしっかりとサポートしており、イノベーションを促進しコストを削減します。さらに、Juniper Apstraのインテントベースのファブリック管理と自動化ソフトウェアを使用した、マルチベンダーデータセンター運用にも取り組んでいます。

Electronic circuit board and digital information technology concept.

エクスペリエンスファースト運用

データセンターネットワークはますます複雑化しており、AIワークロードのパフォーマンス要件を満たすためには新しいプロトコルが必要です。JunosオペレーティングシステムとJuniper Apstraデータセンター管理ソフトウェアを使って自動化することで、ネットワーク事業者はこのような複雑さを扱う必要がなくなり、マルチベンダーを採用した、エクスペリエンスファーストアプローチでデータセンター運用を合理化することができます。

関連ソリューション

データセンターネットワーク

自動化された最新のデータセンターで、運用を簡素化し、信頼性を確保します。ジュニパーは、ネットワークのライフサイクル全体を自動化し、継続的に検証することで、設計、導入、運用を容易にします。

データセンターの相互接続

ジュニパーのDCIソリューションは、従来の拡張性の制約、ベンダーロックイン、相互運用性の課題を打破するシームレスな相互接続を実現します。

統合型光ルーティングアーキテクチャ(CORA)

CORAは、IP光コンバージェンス向けの、拡張可能、持続可能で自動化されたソリューションです。CORAは、事業者が400G以上のネットワーキングを目的として、メトロ、エッジ、コアの各ネットワークにIP-over-DWDMの革新的な戦略を導入する場合に、不可欠な構成要素です。

IPストレージネットワーキング

全IPストレージネットワークでデータストレージを簡素化し、データセンターのパフォーマンスを向上させます。100G/400Gスイッチングを備えたNVMe/RoCEv2やNVMe/TCPなどの最新の技術を使用して、高性能ストレージを構築するか、ストレージとデータを単一のネットワークに統合することができます。

導入事例

SambaNova社は、高性能で計算量の多い機械学習を単純かつ拡張性の高いものにします

AIは、ヘルスケア、金融サービス、製造、小売、およびその他の業界を変革することが約束されていますが、人間の努力のスピードと効果を高めようとする多くの組織では、まだAIの可能性を十分に引き出せていないのが現状です。

複雑で計算量の多い機械学習(ML)の構築の複雑さを克服するために、SambaNova社はDataScaleを設計しました。DataScaleは、SambaNova SystemsのReconfigurable Dataflow Architecture(RDA)を用いて設計され、オープンスタンダードとユーザーインターフェースを用いて構築され、アルゴリズムからシリコンまで最適化されたソフトウェアとハードウェアの統合システム・プラットフォームです。ジュニパーのスイッチングは、SambaNova社のDatascaleシステムおよびサービス用に大量のデータを転送します。  

SambaNova社のイメージ

AIデータ センターネットワークに関する良くある質問

現在、どのような業種の企業が、データセンターにAI/MLソリューションを導入することを優先しているのですか?

AIの需要により、ハイパースケラー、クラウドプロバイダ、エンタープライズ、政府機関そして教育機関が、AIをビジネスシステムに組み込んで運用を自動化し、コンテンツと通信を生成し、カスタマーサービスを向上させています。

AIのトレーニング段階と推論段階の違いは何ですか?

AIモデルは、トレーニング段階で慎重に作成されたデータセットを使用して構築されます。トレーニングは、クラスター内の数十、数百、数千に及ぶ複数のGPUにわたって実施され、これらのGPUはすべてネットワークを介して接続されており、絶え間なくデータを相互に交換しています。このトレーニング段階の、モデルは基本的に完了します。推論段階では、ユーザーがモデルと対話します。これにより、モデルは画像を認識し、ユーザーの質問に対する答えを提供するために画像やテキストを生成することができるようになります。トレーニングは通常オフラインで実行されますが、推論は通常オンラインで行われます。

AIデータセンターネットワークインフラストラクチャソリューションのコンポーネントとは何ですか?また、ジュニパーではどのようにそれらを実現していますか?

大量にあるAIデータセットにより、計算処理能力の向上、ストレージの高速化、大容量で低遅延のネットワーキングが求められています。ジュニパーは、以下の方法でこれらの要件を満たすことができます。 

  • 計算:AI/ML計算クラスターは、ノード間ネットワークに重い要件を課します。ジョブ完了までにかかる時間(JCT)を短縮することが不可欠であり、クラスターの効率的な運用にはネットワークが重要な役割を果たします。ジュニパーは、ディープバッファ機能と混雑管理を備えた高性能なノンブロッキングスイッチを幅広く提供しており、最適な構成で設計することで、ネットワーク上のボトルネックを解消することができます。
  • ストレージ:AI/MLクラスターと高性能コンピューティングでは、データセットやモデル全体が計算ノードに保存されることはめったになく、高性能のストレージネットワークが必要になります。Juniper QFXシリーズスイッチは、IPストレージ接続に使用することができ、不揮発性メモリエクスプレス/RDMA over Converged Ethernet(NVMe/RoCE)やネットワークファイルシステム(NFS)/RDMAを含めたリモートダイレクトメモリーアクセス(RDMA)ネットワーキングをすべてサポートします。
  • ネットワーク:AIトレーニングモデルでは、数百または数千のCPU、GPU、TPUプロセッサに分散された、大規模で過大な計算処理が必要とされます。これらの計算には、大容量で水平方向に拡張可能であり、エラーのないネットワークが必要となります。Juniper QFXスイッチPTXシリーズルーターは、業界をリードするスイッチングおよびルーティングスループットとデータセンターの相互接続(DCI)機能により、データセンター内およびデータセンター間でのこれらの大規模な計算処理をサポートします。

ジュニパーAIデータ センターネットワークソリューションは、AIパフォーマンスを最大化するにあたり、混雑管理、ロードバランシング、遅延に対する要件にどのように対処しますか?

ジュニパーの高性能でノンブロッキングのデータセンタースイッチは、ディープバッファリングと混雑管理を提供することで、ネットワーク上のボトルネックを解消します。トラフィックの負荷を分散させるため、ジュニパーは動的ロードバランシングと適応ルーティングをサポートしています。混雑管理では、 Data Center Quantized Congestion Notification(DCQCN)、優先フロー制御(PFC)、および明示的な混雑通知(ECN)をフルサポートしています。さらに、遅延を軽減するために、ジュニパーでは最も優れたマーチャントシリコンとカスタムASICアーキテクチャを採用しており、当社のスパインアーキテクチャ内のバッファ、仮想出力キューイング(VOQ)およびセルベースのファブリックを必要に応じて最大化することができます。

ジュニパーはIPストレージに何を提供していますか?

当社のポートフォリオには、オープンなスタンダードベースのスイッチが含まれており、NVMe/RoCEまたはNFS/RDMAを使用したIPベースのストレージ接続性を提供します(前述の良くある質問を参照)。当社のIPストレージネットワーキングソリューション設計は、小さな4ノード構成から数百または数千におよぶストレージノードまでに拡張することができます。