ソリューションブリーフ:オープンかつイーサネットベースのAIデータセンターネットワーク

高速性、効率性、経済性を備えた、エンドツーエンド、マルチベンダー、インテントベースのAIネットワーキング

ソリューションブリーフのダウンロード

課題

AI クラスターの展開は複雑で、時間とコストがかかります。AI アプリケーションに投資する企業はリソースに限りがあるため、ベンダーロックインに陥ることなく、AI データセンターを展開し、高額なGPUリソースを最適化するのが困難です。

 

ソリューション

ジュニパーのAIデータセンターソリューションにより、ハイパフォーマンスのAI学習、推論、ストレージクラスターを非常に高速かつ柔軟に展開できます。また、非常にシンプルであるため、限られたITリソースで運用できます。

 

メリット

- Day0、Day1、Day2以降の運用の簡略化により、必要なリソース、時間、コストを削減できます。
- オープンで柔軟性があるため、ベンダーロックインに陥ることなく、実証済みのテクノロジーと製品を使用して、GPUを問わないネットワーク(InfiniBandと同等のパフォーマンス)を設計できます。
- 信頼できる製品が揃った、エンドツーエンドかつ検証済みのターンキーソリューションにより、迅速に展開できます。

 

従来のデータセンターテクノロジーや設計では、インフラのAIワークロードに求められる要件(パフォーマンス、容量、遅延)に対応できません。バックエンドのトレーニングとフロントエンドの推論のファブリック設計を特徴とするAIデータセンターには、最先端のソリューション(コンピューティング、ストレージ、ネットワーキング)が必要です。このような状況を受けて、高性能のGPU(グラフィック処理ユニット)と、単一ベンダーが提供する独自仕様のInfiniBandネットワーキングに対するニーズが急増しています。その結果、価格が上昇し、サプライチェーンにボトルネックが生じています。そこで、コストを抑えながら、イノベーションと柔軟性を促進することが企業にとって不可欠となっています。コストを大幅に抑えながらGPUのパフォーマンスを最適化するために、多くの企業が、AIデータセンター向けのオープンネットワークとしてイーサネットに目を向けています。

 

課題

業界を問わず、AIは実験の対象から、業務成果を達成するためのツールへと移行しており、AI設計者やIT担当者の業務は突如として変化しています。AIの価値を最大限に引き出すためには、AIの展開に伴う複雑性を管理して、AIのコストや適切なリードタイムに対応しなければなりません。

選択肢の少ないGPUと独自仕様のInfiniBandネットワーキングにより、サプライチェーンの遅れや在庫の不足が発生し、高価かつ稀少なAIインフラストラクチャのコストが上昇しています。たとえば、1つのGPUが30,000ドル以上するため、GPUを使用するAIサーバーは400,000ドル以上に上る場合があります。小規模GPUクラスターでも数百万ドル、大規模GPUクラスターなら数億ドルにも上ります。

データセンターネットワークはAIを支えるエンジンであり、GPUを相互接続して、利用率を最大化する上で重要な役割を果たします。高速化とコスト削減のカギとなるのは、ジョブ(AIのトレーニング)の完了までにかかる時間(JCT)を短縮することです。

また、AIの導入を成功に導くためには、需要に対して市場が迅速に対応しなければなりません。単一ベンダーのソリューションへの依存を緩和するために、各ベンダーが競争を繰り広げるオープンな市場を育てることに業界全体が取り組んでおり、幅広いGPUと、世界で最も普及しているL2テクノロジーであるイーサネットを使用するようになっています。

 

ジュニパーネットワークスのAIデータセンターネットワークソリューション

ジュニパーのAIデータセンターソリューションにより、ハイパフォーマンスのAI学習、推論、ストレージクラスターを非常に高速かつ柔軟に展開できます。また、非常にシンプルであるため、限られたITリソースで運用できます。ジュニパーは、独自のインテントベースの運用、AIネイティブの仮想ネットワークアシスタント、ジュニパー検証済み設計により、AIデータセンターネットワークの設計、展開、トラブルシューティングを簡略化します。さらに、多様なシリコン、マルチベンダーのスイッチ管理、スタンダードベースのオープンなイーサネットファブリックへの取り組みにより、お客様に最高の柔軟性を提供するとともに、ベンダーロックインを回避できます。

Figure 1: Juniper Networks AI Data Center Networking Solutions

図1:ジュニパーネットワークスのAIデータセンターネットワークソリューション

運用の簡素化

Day0、Day1、Day2 以降の運用の簡略化により、必要なリソース、時間、コストを削減できます。ジュニパーのソフトウェアは、業界屈指のインテントベースネットワーク構築を可能にする唯一のマルチベンダーデータセンター自動化プラットフォームです。手動の設定により発生する問題を回避できるため、導入とトラブルシューティングにかかる時間を短縮できます。たとえば、Apstraにより、高度なロードバランシング、ECN(Explicit Congestion Notification:明示的な混雑通知)、PFC(Priority Flow Control:優先フロー制御)など、ハイパフォーマンスなロスレスAIネットワーキングに不可欠な機能をファブリック全体に適用できます。CLIコマンドの入力は一切不要です。Apstraのリアルタイムネットワークフロー視覚化機能により、ヒートマップやインテントベースの解析を通じて、AIデータセンターの混雑のホットスポットを特定し、迅速に問題を解決できます。

Apstraは、クローズドループアシュアランスを備えた信頼できる単一の情報源として、強力な解析機能によって問題を予測して事前対応的に解決し、サービスの中断を回避します。ブループリントがテンプレート化されているため、信頼性、一貫性、反復性が確保されており、運用コストを90%削減し、導入の時間を85%短縮できます。

ジュニパーは、Mist AIとApstraの統合により、データセンターにAIOpsをもたらします。これにより、さらなる自動化と分析情報を通じてデータセンターのエクスペリエンスを最適化できます。データセンター向けの仮想ネットワークアシスタントMarvisは、Apstraの機能豊富なストリーミングテレメトリとリアルタイムモニタリングをMarvisダッシュボードに拡張して、運用ドメイン全体で事前対応型のトラブルシューティングと解析を可能にします。この統合は、マルチベンダーデータセンターに対してAIドリブンの実用的な分析情報を提供するための、基本となる最初の一歩です。また、Marvisを使用している、キャンパスや支社/拠点の運用担当者は、データセンターの問題を同じダッシュボードで確認できるようになりました。

 

オープンな柔軟性

オープンかつ柔軟なイーサーネットソリューションにより、実証済みのテクノロジーと製品を使用して、ベンダーロックインを回避できます。AIで最適化された、ジュニパーの新しいハイラディックス800GbEリーフ/スパインデータセンターファブリックは、高度なトラフィック管理機能を備えており、イーサネットによる高帯域幅、低遅延、ロスレス、拡張可能なパフォーマンスを確保します。イーサネットにより、最大1.6テラビットまで拡張し、マルチベンダーのGPUをサポートできるため、コストを削減して、イノベーションを加速し、設計の柔軟性を大幅に高めて、サプライチェーンの課題を回避できます。RoCEv2(Remote Direct Memory Access over Converged Ethernet v2)をサポートするジュニパーのイーサネットファブリックは、データセンター(DC)ファブリックを管理および自動化するための唯一のマルチベンダーソリューションです。バックエンドのAIトレーニングモデルとフロントエンドのAI推論モデル向けに最適化されています。

 

ターンキーソリューション

信頼できる製品が揃った、エンドツーエンドかつ検証済みのターンキーソリューションにより、データセンターに迅速に展開できます。エンドツーエンドのネットワークソリューションがあれば、ハイパフォーマンスなAIデータセンターを柔軟かつ容易に構築できます。データセンター向けのJuniper Networks®PTXシリーズルーターは、新たな高密度800 GbE PTX10002-36QDD固定スイッチと、PTX10000シャーシ向けの新たな800 GbEラインカードによって拡張されました。Express 5カスタムシリコン上に構築された最大のPTX10000シャーシ は、高基数スパインとスーパースパインアーキテクチャ向けに最大576 x 800 GbEのポートをサポートしています。さらに、最新のBroadcom Tomahawk 5 ASICを基盤とする、新たな高密度800 GbE QFX5240固定プラットフォームは、ハイパフォーマンス、拡張可能、高電力効率のAIデータセンター向けに各種シリコンを提供します。

ジュニパーのQFXおよびPTXシリーズプラットフォームの卓越したパフォーマンス、拡張性、混雑制御により、AIクラスターのピーク運用にも確実に対応できます。ジュニパーのAI最適化イーサネットは、MLPerfベンチマークテストにおいて、ジョブ(ワークロードのトレーニング)の完了までにかかる時間(JCT)がInfiniBandと同等でした。このイーサネットにより、ベンダーロックインを回避しながら、オープンかつハイパフォーマンスなファブリックを構築できます。AIの導入を簡略化するため、ジュニパーは新たなJVD(ジュニパー検証済み設計)を採用しています。AIのJVDは、規定のレール最適化済みまたはマルチレイヤー化されたClosファブリックを実現し、スイッチング、運用、セキュリティを含むデータセンターソリューション一式を提供します。ジュニパーのラボの専門家によって厳格にテスト、検証、文書化されています。既成の設定として、またはリスクを低減しAIクラスターごとに適切なサイズと予算を割り当てるためのガイドラインセットとして使用できます。

 

特長とメリット

運用の簡略化:Day0、Day1、Day2以降の運用の簡略化により、必要なリソース、時間、コストを削減できます。業界屈指のインテントベースネットワーク構築により、手動設定に起因する問題を回避できるため、(ハードウェアのベンダーを問わず)導入とトラブルシューティングにかかる時間が短縮されます。

  • クローズドループアシュアランスを備えた信頼できる単一の情報源として、問題を予測して事前対応的に解決し、サービスの中断を回避します。
  • 唯一のデータセンター向けAIOpsにより、さらなる自動化と分析情報を通じてデータセンターのエクスペリエンスを最適化できます。
  • コスト効率に優れたソリューションにより、運用コストを90%削減し、導入を85%高速化できます。

オープンな柔軟性:実証済みのテクノロジーと製品を使用してネットワークを設計し、ベンダーロックインを回避できます。

  • 高度なトラフィック管理機能により、イーサネットによる高帯域幅、低遅延、ロスレス、拡張可能なパフォーマンスを確保できます。
  • イーサネットを活用することで、コストを削減して、イノベーションを加速し、設計の柔軟性を大幅に高めて、サプライチェーンの課題を回避できます。
  • データセンターファブリックを管理および自動化するための唯一のマルチベンダーソリューションにより、設計の柔軟性が大幅に向上します。
  • あらゆるGPU、ファブリック、スイッチで相互運用可能です。

ターンキーソリューション信頼できる製品が揃った、エンドツーエンドかつ検証済みのターンキーソリューションにより、迅速に展開できます。

  • 多様なシリコンにより、拡張性、パフォーマンス、柔軟性を促進できます。数千ものGPUについて、Broadcomとカスタムシリコンの、非常に高速(800 Gbps)の相互接続をサポートしています。また、あらゆるデータセンターファブリック構成をサポートしています。
  • 包括的なデータセンターセキュリティポートフォリオにより、エンドツーエンドのセキュリティを確保できます。
  • ジュニパー検証済み設計により、スイッチング、運用、セキュリティなど、すべてがそろったデータセンターソリューションを導入できます。
  • ジュニパーが提供する幅広いスイッチ(多様なシリコン)により、拡張性とパフォーマンスを促進できます。
  • ゼロトラストデータセンターを保護するための統合脅威防御を備えた、包括的なデータセンターセキュリティポートフォリオを利用できます。
  • データセンターネットワークの信頼性を10倍改善できます。

 

ソリューションコンポーネント

Apstra:ジュニパーのデータセンター自動化ソリューションにより、設計から継続的な運用まで、マルチベンダー環境のデータセンターネットワークのライフサイクル全体を自動化できます。Apstraにより、継続的な検証、信頼できる唯一の情報源、強力な解析、根本原因の迅速な特定と修正を実現できます。

QFXシリーズスイッチ:業界をリードするスイッチシリーズは、優れたスループットと拡張性、包括的なルーティングスタック、Junos® OSのオープンなプログラマビリティ、最も幅広いEVPN-VXLANおよびIPファブリック機能を備えています。

PTXシリーズルーター:PTXシリーズルーターは、世界最大級のコアおよびWANアーキテクチャの基盤を形成しています。最新世代のExpressファミリーASICsを搭載することで、クラウド向けに最適化され、800 GbEにスムーズに移行できます。今日の市場ニーズに対応するために必要な規模、柔軟性、および投資保護を同時に提供します。

データセンター向け仮想ネットワークアシスタント「Marvis」:Marvisは、業界初で唯一のデータセンター向けのAIネイティブ仮想ネットワークアシスタントです。ハードウェアベンダーを問わず、データセンターのライフサイクル全体を通じて、非常に優れた分析情報を出力します。さらに、キャンパスから支社/拠点、データセンターに至るまで、あらゆるエンタープライズドメインにエンドツーエンドの可視性とアシュアランスをもたらします。

Junos OS Evolved:信頼性、俊敏性、オープン性に優れたプログラマビリティを備えた、エンドツーエンドの統合型ネットワークオペレーティングシステムです。Junos OS Evolvedにより、クラウド規模の導入を成功へと導くことができます。

 

概要:AIデータセンターのための運用の簡略化、オープンな柔軟性、ターンキーネットワーキング

事実上あらゆる企業が、データセンターのインフラストラクチャを最大限に活用してAI関連の取り組みを実行するための戦略を策定しています。ジュニパーのAIデータセンターソリューションにより、AIトレーニングと推論に適した、拡張性に優れた高性能ネットワークを非常に迅速かつ容易に構築できます。ジュニパーは、マルチベンダーでインテントベースの運用、AIネイティブの仮想ネットワークアシスタント、ジュニパー検証済み設計により、複雑なAIデータセンターネットワークを簡略化します。

 

3510814 - 001 - JP 2024年1月