Solutions & Technologies
Réseau de datacenter dédié à l'IA
Les avancées spectaculaires de l’IA générative ont captivé l'imagination de centaines de millions de personnes dans le monde et catapulté l'IA et le machine learning (ML) sous les projecteurs des entreprises. Véritables moteurs de l’IA, les datacenters et leurs réseaux sont essentiels pour interconnecter les serveurs GPU coûteux et maximiser leur utilisation lors des tâches de traitement intensives servant à entraîner les IA.
Lorsqu’ils sont spécifiquement optimisés pour des charges de travail IA/ML, les réseaux de datacenters nécessitent des capacités particulières de gestion des encombrements, d'équilibrage de charge et plus encore, afin d'optimiser les performances et la rentabilité de l'entraînement des modèles d'IA. La solution Juniper répond à ces besoins avec des fabrics réseau haute capacité, évolutives et non bloquantes qui assurent les meilleures performances pour l’IA.
Améliorer la rentabilité de l'IA
Pour être rentable, l'entraînement IA nécessite des réseaux de pointe rapides, simples et intelligents.
Comment Juniper peut vous aider
L'innovation de Juniper pousse sans cesse vers de nouveaux seuils d'évolutivité, de performances et d'expérience utilisateur. Avec notre solution de réseaux pour l’IA, les clients peuvent créer des fabrics réseau haute capacité, évolutives et faciles à utiliser, qui offrent le délai de réalisation de jobs (JCT) le plus rapide du marché, tout en maximisant la rentabilité et l'utilisation des GPU.
Fabrics d'IA hautes performances
Diminuer le coût d’entraînement des modèles d'IA demande principalement d'optimiser l'utilisation des GPU et de réduire les temps d'arrêt. Notre solution de réseau dédié à l'IA optimise le JCT et minimise la latence de queue avec un mélange clé : des commutateurs fixes de tailles diverses à grande densité de ports et notre large gamme de circuits intégrés. Basse consommation et optimisée à grande échelle, cette solution offre ainsi une grande souplesse d'utilisation.
Une solution ouverte basée sur des normes
Les solutions propriétaires qui enferment les entreprises peuvent freiner l'innovation en matière d'IA. Juniper soutient pleinement la norme Ethernet dans les réseaux de datacenters et son large écosystème de fournisseurs qui stimule l'innovation et réduit les coûts. De plus, nous favorisons les opérations multifournisseurs dans les datacenters grâce à notre logiciel Juniper Apstra de gestion et d'automatisation de fabrics basées sur l'intention.
Des opérations axées sur l'expérience
Les réseaux de datacenter sont de plus en plus complexes et nécessitent de nouveaux protocoles pour répondre aux exigences de performance des charges de travail IA. Grâce à notre système d'exploitation Junos et à notre logiciel de gestion de datacenter Juniper Apstra, l'automatisation protège les opérateurs réseau de cette complexité et simplifie les opérations de datacenter avec une approche multifournisseur axée sur l'expérience.
Solutions apparentées
Réseaux de datacenters
Simplifiez les opérations et assurez la fiabilité avec le datacenter moderne et automatisé. Juniper vous aide à automatiser et à valider en continu l’intégralité du cycle de vie du réseau pour faciliter la conception, le déploiement et les opérations.
Interconnexion des datacenters
Les solutions DCI de Juniper facilitent une interconnectivité transparente qui dépasse les limites traditionnelles d'évolutivité, le verrouillage aux fournisseurs et les défis d'interopérabilité.
Architecture de routage optique convergente (CORA)
CORA est une solution automatisée, extensible et durable pour la convergence IP-optique. Elle fournit les composants essentiels dont les opérateurs ont besoin pour déployer les stratégies de transformation IP sur DWDM pour les réseaux 400G et au-delà dans les réseaux urbains, en périphérie et centraux.
Réseau de stockage IP
Simplifiez le stockage de vos données et boostez les performances de votre datacenter grâce aux réseaux de stockage tout IP. Utilisez les dernières technologies, telles que le protocole NVMe/RoCEv2 avec une commutation 100G/400G ou le protocole NVMe/TCP pour construire un stockage haute performance ou faire converger votre stockage ou vos données en un seul réseau.
RÉUSSITE CLIENT
SambaNova rend le machine learning de haut niveau et lié au calcul facile et évolutif
L'IA promet de transformer les soins de santé, les services financiers, la fabrication, le commerce et d'autres secteurs. Cependant, de nombreuses organisations qui cherchent à améliorer la vitesse et l'efficacité humaines n'ont pas encore atteint le plein potentiel de l'IA.
Pour que le machine learning (ML) complexe utilisant le calcul soit plus facile à concevoir, SambaNova a conçu DataScale. Conçue à l'aide de l'architecture de flux de données reconfigurable (RDA) de SambaNova Systems et basée sur des normes ouvertes et des interfaces utilisateur, DataScale est une plate-forme logicielle et matérielle intégrée, optimisée depuis le chipset jusqu'aux algorithmes La commutation Juniper déplace d'énormes volumes de données pour les systèmes et services Datascale de SambaNova.
Centre de ressources
Livres blancs
Vidéos
Questions fréquentes sur les réseaux de datacenters dédiés l'IA
Quels types d'entreprises donnent aujourd'hui la priorité au déploiement de solutions d'IA/ML dans leurs datacenters ?
La demande en matière d'IA pousse les hyperscalers, les fournisseurs de cloud, les entreprises, les administrations publiques et les établissements d'enseignement à intégrer l'IA dans leurs systèmes afin d'automatiser les opérations, de générer du contenu et des communications, et d'améliorer le service client.
Quelle est la différence entre les phases d’entraînement et d'inférence de l'IA ?
es modèles d'IA sont développés en utilisant des ensembles de données soigneusement élaborés pendant la phase d’entraînement, qui fait appel à plusieurs dizaines, centaines ou même milliers de GPU dans un cluster. Ils sont tous reliés au sein d'un réseau et échangent en permanence des données les uns avec les autres. Après cette phase d’entraînement, le modèle est plus ou moins complet. Au cours de la phase d'inférence, les utilisateurs interagissent avec le modèle qui peut identifier ou produire des images ou du texte pour répondre aux questions des utilisateurs. L’entraînement se déroule généralement hors ligne, à l’inverse de l'inférence.
Quels sont les composants de la solution, et quelle est leur implémentation ?
Le traitement des ensembles de données massifs de l'IA doit nécessairement s’appuyer sur des capacités de calcul renforcées, un stockage plus rapide et un réseau à haute capacité et faible latence. Juniper vous aide à répondre à ces exigences comme suit.
- Calcul : les clusters de calcul d'IA/ML pèsent lourdement sur le réseau entre les nœuds. Il faut donc réduire les délais de traitement des jobs (JCT) au maximum, car l’efficacité du cluster dépend fortement du réseau Juniper propose des commutateurs hautes performances non bloquants, dotés d'une large mémoire tampon et capables de gérer les encombrements. Dans une conception de réseau optimale, ils éliminent tout goulot d'étranglement.
- Stockage : en matière de clusters d'IA/ML et de calcul hautes performances, il est rare qu'un ensemble ou qu'un modèle de données puisse être stocké en intégralité sur les nœuds de calcul. Un réseau de stockage hautes performances est donc nécessaire. Les commutateurs QFX Series de Juniper peuvent être utilisés pour la connectivité du stockage IP, étant entièrement compatibles avec les réseaux RDMA (Remote Direct Memory Access), y compris avec NVMe/RoCE (Non-Volatile Memory Express/RDMA sur Ethernet convergé) et NFS (Network File System)/RDMA.
- Réseau : les modèles d’entraînement d'IA reposent sur des calculs volumineux et intenses, répartis sur des centaines ou des milliers de CPU, GPU et TPU. Ces calculs exigent des réseaux de haute capacité, évolutifs sur le plan horizontal et sans erreurs. Les commutateurs QFX et les routeurs PTX Series de Juniper prennent en charge ces calculs volumineux dans et entre les datacenters grâce à un débit de commutation et de routage de premier ordre et à des capacités d'interconnexion de datacenters (DCI).
Comment la solution dédiée à l'IA de Juniper permet-elle de gérer les encombrements, d'équilibrer les charges et de satisfaire aux exigences de latence pour maximiser les performances de l'IA ?
Nos commutateurs de datacenter hautes performances et non bloquants intègrent une mémoire tampon profonde et assurent la gestion des encombrements afin d'éliminer les goulots d'étranglement du réseau. L'équilibrage de charge dynamique et le routage adaptatif équilibrent les charges de trafic. Pour gérer les encombrements, Juniper prend entièrement en charge les mécanismes DCQCN (Data Center Quantized Congestion Notification), PFC (Priority Flow Control) et ECN (Explicit Congestion Notification). Enfin, pour réduire la latence dans son architecture dorsale, Juniper utilise les meilleurs circuits du marché, des architectures ASIC personnalisées qui maximisent les tampons selon les besoins, mais aussi le Virtual Output Queueing (VOQ) et des fabrics cellulaires.
Que propose Juniper pour le stockage IP ?
Notre portefeuille comprend des commutateurs ouverts et standardisés dotés d’une connectivité de stockage IP via les protocoles NVMe/RoCE ou NFS/RDMA (voir question précédente). Notre solution de réseau de stockage IP s'étend d'une configuration à quatre nœuds, à des centaines ou des milliers de nœuds de stockage.
