redes del centro de datos de IA

Experiencias de los operadores sencillas y sin problemas que ahorran tiempo y dinero

Los avances recientes en inteligencia artificial (IA) generativa han capturado la imaginación de cientos de millones de personas en todo el mundo y catapultaron la IA y el aprendizaje automático (ML) al centro de atención corporativo. Los centros de datos son los motores detrás de la IA y las redes del centro de datos juegan un papel fundamental en la interconexión y maximización del uso de servidores de GPU costosos.

El entrenamiento de la IA, medido por el tiempo de culminación del trabajo (JCT), es un enorme problema de procesamiento paralelo. Se necesita una estructura de red rápida y confiable para obtener el máximo provecho de sus costosos GPU. La red adecuada es la clave para optimizar el ROI y la fórmula es sencilla: diseñar la red correcta para ahorrar mucho en aplicaciones de IA.

ai-data-center-network-solution

Cómo ayuda Juniper

La solución del centro de datos de IA de Juniper es una manera rápida de implementar el entrenamiento de IA de alto rendimiento y redes de inferencia que son las más flexibles de diseñar y las más fáciles de gestionar con recursos de TI limitados. Integramos AIOps líder en la industria y tecnologías de red de clase mundial para ayudar a los clientes a desarrollar estructuras de red de alta capacidad y fáciles de operar, que proporcionan los tiempos de compleción del trabajo más veloces, a la vez que maximizan la utilización de GPU con un uso limitado de recursos de TI.

Business intelligence analyst dashboard on virtual screen. Big data Graphs Charts.

Las operaciones simplificadas disminuyen los costos operativos relacionados con las redes hasta un 90 %

Nuestro enfoque de que las operaciones son lo primero ahorra tiempo y dinero sin dependencia del proveedor. La automatización exclusiva basada en la intención deJuniper Apstraprotege a los operadores de la complejidad de la red y acelera la implementación. Las nuevas capacidades de AIOps en el centro de datos con Marvis, nuestro asistente de red virtual (VNA), mejoran además las experiencias de los operadores y de los usuarios finales al permitirles a los clientes ver y solucionar proactivamente problemas con rapidez. El resultado son tiempos de implementación hasta 85 % más rápidos cuando se usa Juniper para las redes del centro de datos de IA.

Modern high rise building with sky view

100 % interoperable con todas las GPU, estructuras y conmutadores líderes

Las soluciones patentadas que se bloquean en las empresas pueden sofocar la innovación de IA. La solución de Juniper asegura la innovación más rápida, maximiza la flexibilidad del diseño y previene la dependencia del proveedor para las redes de IA de backend, frontend y almacenamiento. Nuestra solución de Ethernet abierta optimizada para IA asegura una velocidad distintiva y ahorros en los costos, mientras Apstra es la única solución para las operaciones de centros de datos y garantiza todas las redes de los diversos proveedores. Con Juniper, tiene la libertad de elegir cualquier GPU, estructura y conmutador para satisfacer de manera óptima las necesidades individuales de las redes del centro de datos.

Top down aerial view of Chicago Downtown skyscrapers. Urban grid with streets and tall buildings. Late afternoon light

Las soluciones preconfiguradas otorgan una fiabilidad hasta 10 veces mejor

Juniper proporciona soluciones preconfiguradas para implementar centros de datos de IA de alto rendimiento con flexibilidad y facilidad, desde la conmutación y enrutamiento hasta las operaciones y la seguridad. Los diseños validados de Juniper (JVD) simplifican la implementación y los procesos de resolución de problemas para que usted pueda crear el próximo gran modelo de IA con confianza y velocidad. La diversidad de silicio en nuestros productos impulsa la escala, el rendimiento y la flexibilidad de los clientes, mientras la seguridad integrada protege las cargas de trabajo de IA y la infraestructura de los ciberataques.

Explore el centro de datos de IA de Juniper

Descubra las soluciones con seguridad de extremo a extremo que le permiten crear centros de datos de IA de alto rendimiento con flexibilidad y facilidad. Mire el video de explicación para conocer cómo la solución de Ethernet optimizada para IA abierta de Juniper asegura velocidad distintiva y ahorro en costos.

Soluciones relacionadas

Redes del centro de datos

Simplifique las operaciones y asegure la confiabilidad con el centro de datos automatizado y moderno. Juniper lo ayuda a automatizar y validar continuamente todo el ciclo de vida de la red para facilitar el diseño, el despliegue y las operaciones.

Interconector del centro de datos

Las soluciones DCI de Juniper permiten generar una interconectividad sin interrupciones que supera las limitaciones de escalabilidad tradicionales, el bloqueo de proveedores y los desafíos de interoperabilidad.

Arquitectura de enrutamiento óptico convergente (CORA)

La CORA es una solución automatizada, sostenible y extensible para la convergencia óptica a través de IP. Proporciona los componentes esenciales que los operadores necesitan para implementar estrategias transformadoras de IP a través de MDCLO para las redes 400G y más allá en redes de núcleo, borde y área metropolitana.

Redes de almacenamiento de IP

Simplifique su almacenamiento de datos e impulse el rendimiento del centro de datos con redes de almacenamiento de todas las IP. Utilice las últimas tecnologías, como NVMe/RoCEv2 con conmutación de 100G o 400G, o NVMe/TCP, para crear un almacenamiento de alto rendimiento o convergir su almacenamiento y sus datos en una sola red.

ÉXITO DEL CLIENTE

SambaNova hace que el aprendizaje automático de alto rendimiento y vinculado a la CPU sea fácil y escalable.

La IA promete transformar la atención médica, los servicios financieros, la fabricación, la venta minorista y otras industrias, pero muchas organizaciones que buscan mejorar la velocidad y la efectividad de los esfuerzos humanos aún no han alcanzado el potencial completo de la IA.

Para superar la complejidad de desarrollar el aprendizaje automático (ML) complejo y vinculado a la CPU, SambaNova diseñó DataScale. Diseñado a partir de la arquitectura Dataflow reconfigurable (RDA) de SambaNova Systems y construido mediante estándares abiertos e interfaces de usuario, DataScale es una plataforma de sistemas de software y hardware integrada optimizada de algoritmos a chips. La conmutación de Juniper mueve volúmenes masivos de datos para los sistemas y servicios de escala de datos de SambaNova.  

Imagen de SambaNova

Preguntas frecuentes de redes del centro de datos de IA

¿Qué tipos de empresas están priorizando el despliegue de soluciones de IA/ML en sus centros de datos hoy?

La demanda de IA está impulsando a los hiperescaladores, los proveedores de nube, las empresas, los gobiernos y las instituciones educativas a incorporar IA en sus sistemas comerciales para automatizar las operaciones, generar contenido y comunicaciones y mejorar el servicio al cliente.

¿Cuál es la diferencia entre las etapas de entrenamiento e inferencia de IA?

Los modelos de IA se construyen utilizando conjuntos de datos cuidadosamente diseñados durante la etapa de capacitación. El entrenamiento sucede en diversos GPU y abarca decenas, cientos e incluso miles de GPU en un grupo, todos conectados en una red y constantemente intercambiando datos entre sí. Después de esta etapa de capacitación, el modelo está esencialmente completo. Durante la etapa de inferencia, los usuarios interactúan con el modelo, que puede reconocer imágenes o generar imágenes y texto para proporcionar respuestas a las preguntas de los usuarios. El entrenamiento es típicamente una operación sin conexión, mientras que la inferencia generalmente es en línea.

¿Cuáles son los componentes de la solución de infraestructura de red de centro de datos de IA y cómo los habilita Juniper?

Los conjuntos de datos masivos de IA están creando la necesidad de una mayor potencia informática, un almacenamiento más rápido y redes de alta capacidad y baja latencia. Juniper ayuda a satisfacer estos requisitos de las siguientes maneras:

  • Cómputo: los clústeres de computación de IA/ML generan enormes requisitos en la red entre nodos. Reducir el tiempo de culminación del trabajo (JCT) es esencial y la red juega un papel clave en la operación eficiente del grupo. Juniper ofrece una gama de conmutadores no bloqueantes de alto rendimiento con capacidad de búfer profundo y administración de congestión que, cuando se diseñan de manera óptima, eliminan cualquier demora de la red.
  • Almacenamiento: en los grupos de IA/ML y la computación de alto rendimiento, rara vez se puede almacenar un conjunto o modelo completo de datos en los nodos de cálculo, por lo que se requiere una red de almacenamiento de alto rendimiento. Los conmutadores de la serie QFX de Juniper se pueden usar para la conectividad de almacenamiento IP; ofrecen soporte completo para redes de acceso directo de memoria remota (RDMA), incluida la memoria no volátil Express/RDMA sobre Ethernet convergente (NVMe/RoCE) y el sistema de archivos de red (NFS) o RDMA.
  • Red: los modelos de entrenamiento de IA implican cálculos grandes e intensos distribuidos en cientos o miles de procesadores de CPU, GPU y TPU. Estos cálculos exigen redes de alta capacidad, escalables horizontalmente y sin errores. Los conmutadores QFX de Juniper y los enrutadores serie PTX admiten estos cálculos dentro y a lo largo de los centros de datos con una transferencia de datos de conmutación y enrutamiento líder en la industria y capacidades de interconector del centro de datos (DCI).

¿Cómo simplifica el centro de datos de IA de Juniper las operaciones en el centro de datos?

Apstra es la plataforma líder de Juniper para la automatización de centro de datos y garantía.   Automatiza todo el ciclo de vida de la red, desde el diseño hasta las operaciones rutinarias, en todos los centros de datos de los diversos proveedores con validación continua, análisis potente e identificación de la causa raíz para asegurar fiabilidad.  Con Marvis VNA para centro de datos, esta información se trae desde Apstra a la nube de Juniper Mist y se presenta en un panel de control de VNA común para información de extremo a extremo.  Marvis VNA para centro de datos también proporciona una interfaz de conversación sólida (usando GenAI) para simplificar drásticamente las consultas a la base de conocimiento.  

¿Cómo aborda la solución de redes del centro de datos de IA de Juniper los requisitos de administración de congestión, equilibrio de carga y latencia para maximizar el rendimiento de IA?

Los conmutadores de centro de datos no bloqueantes de alto rendimiento de Juniper ofrecen administración de congestión y búfer profundo para eliminar los cuellos de botella de red. Para equilibrar las cargas de tráfico, admitimos el equilibrio de carga dinámico y el enrutamiento adaptativo. Para la administración de congestión, Juniper admite completamente la notificación de congestión cuantificada del centro de datos (DCQCN), el control de flujo de prioridad (PFC) y la notificación de congestión explícita (ECN). Finalmente, para reducir la latencia, Juniper usa las mejores arquitecturas de chip comercial y ASIC personalizadas que maximizan los búferes cuando se necesitan, las colas de salida virtual (VOQ) y las estructuras basadas en células dentro de nuestras arquitecturas de spine.

¿Qué ofrece Juniper para el almacenamiento IP?

Nuestra cartera incluye conmutadores abiertos basados en estándares que ofrecen conectividad de almacenamiento basada en IP mediante NVMe/RoCE o NFS/RDMA (consulte las preguntas frecuentes anteriores). Nuestros diseños de solución de redes de almacenamiento IP pueden escalar desde una configuración pequeña de cuatro nodos a cientos o miles de nodos de almacenamiento.