Redes del centro de datos de IA

Experiencias de los operadores sencillas y sin problemas que ahorran tiempo y dinero

Los avances recientes en inteligencia artificial (IA) generativa han capturado la imaginación de cientos de millones de personas en todo el mundo y catapultaron la IA y el aprendizaje automático (ML) al centro de atención corporativo. Los centros de datos son los motores detrás de la IA y las redes del centro de datos juegan un papel fundamental en la interconexión y maximización del uso de servidores de GPU costosos.

El entrenamiento de la IA, medido por el tiempo de culminación del trabajo (JCT), es un enorme problema de procesamiento paralelo. Se necesita una estructura de red rápida y confiable para obtener el máximo provecho de sus costosos GPU. La red adecuada es la clave para optimizar el ROI y la fórmula es sencilla: diseñar la red correcta para ahorrar mucho en aplicaciones de IA.

ai-data-center-network-solution

Cómo Juniper puede ayudar

La solución del centro de datos de IA de Juniper es una manera rápida de implementar el entrenamiento de IA de alto rendimiento y redes de inferencia que son las más flexibles de diseñar y las más fáciles de gestionar con recursos de TI limitados. Integramos tecnologías de AIOps y de redes de clase mundial líderes en la industria para ayudar a los clientes a construir fácilmente estructuras de red de alta capacidad y fáciles de operar que ofrecen las JCT más rápidas, maximizan la utilización de la GPU y usan recursos de TI limitados.

Business intelligence analyst dashboard on virtual screen. Big data Graphs Charts.

Las operaciones simplificadas disminuyen los costos operativos relacionados con las redes hasta un 90 %

Nuestro enfoque de que las operaciones son lo primero ahorra tiempo y dinero sin dependencia del proveedor. La automatización exclusiva basada en la intención de Juniper Apstra protege a los operadores de la complejidad de la red y acelera el despliegue. Las nuevas capacidades de AIOps en el centro de datos con Marvis Virtual Network Assistant mejoran además las experiencias de los operadores y de los usuarios finales al permitirles a los clientes ver y solucionar proactivamente problemas con rapidez. El resultado son tiempos de despliegue hasta un 85 % más rápidos cuando se usa Juniper para redes del centro de datos de IA.

Forrester realizó un estudio de impacto económico total de Juniper Apstra y descubrió que las experiencias típicas de una organización vieron un ROI del 320 % y una recuperación de la inversión en <6 meses.

Modern high rise building with sky view

100 % interoperable con todas las GPU, estructuras y conmutadores líderes

Las soluciones patentadas que se bloquean en las empresas pueden sofocar la innovación de IA. La solución de Juniper asegura la innovación más rápida, maximiza la flexibilidad del diseño y previene la dependencia del proveedor para las redes de IA de backend, frontend y almacenamiento. Nuestra solución Ethernet abierta y optimizada para la IA garantiza velocidad de las funciones y ahorro de costos, mientras que Apstra es la única solución para operaciones del centro de datos y garantía en redes de múltiples proveedores. Con Juniper, tiene la libertad de elegir cualquier GPU, estructura y conmutador para satisfacer mejor las necesidades de redes del centro de datos individuales.

¿Quiere leer la última investigación de IDC sobre cómo el cambio a la “IA en todas partes” está afectando la infraestructura de entrada de datos y cómo las grandes empresas están alojando sus aplicaciones de IA?

Top down aerial view of Chicago Downtown skyscrapers. Urban grid with streets and tall buildings. Late afternoon light

Las soluciones preconfiguradas otorgan una fiabilidad hasta 10 veces mejor

Las soluciones llave en mano de Juniper lo ayudan a implementar centros de datos de IA de alto rendimiento con flexibilidad y facilidad, desde la conmutación y el enrutamiento hasta las operaciones y la seguridad. Los diseños validados de Juniper (JVD) simplifican el despliegue y los procesos de resolución de problemas para que usted pueda crear el próximo gran modelo de IA con confianza y velocidad. La diversidad de silicio en nuestros productos impulsa la escala, el rendimiento y la flexibilidad de los clientes, mientras la seguridad integrada protege las cargas de trabajo de IA y la infraestructura de los ciberataques.

¿Quiere conocer en profundidad cómo la solución de centro de datos de IA de Juniper puede ayudarle a aumentar la eficiencia, reducir el costo operativo y mantener las JCT bajas? Descargue nuestro documento técnico, “Redes del centro de datos de IA”.

AdobeStock_432104296

Solución Juniper Networks y WEKA

Juniper Networks y WEKA ofrecen soluciones del centro de datos escalables, de alto rendimiento y optimizadas para IA a fin de optimizar el rendimiento y la eficiencia de la GPU para acelerar el entrenamiento e inferencia de IA/ML.

AdobeStock_372231814

Vea nuestras soluciones en persona

Asegúrese de que nuestra solución sea la correcta para ayudarlo a acelerar el tiempo de obtención de valor. Los clientes y socios calificados pueden visitar nuestro laboratorio de Ops4AI en Sunnyvale, CA para probar sus cargas de trabajo de IA utilizando el cálculo de GPU, las tecnologías de almacenamiento y las operaciones automatizadas más avanzadas, en todo sobre las estructuras de redes basadas en Ethernet. Probar modelos de IA de vanguardia en hardware de Juniper, Broadcom, Intel, Nvidia, WEKA y más.

Explore las redes para IA

Descubra cómo las soluciones Ethernet pueden superar los obstáculos comunes en las redes de centros de datos de IA con flexibilidad y facilidad. Vea el video para saber cómo la solución Ethernet abierta y optimizada para IA de Juniper garantiza una velocidad de funciones a la par con InfiniBand sin los gastos ni los inconvenientes de una tecnología patentada.

Soluciones relacionadas

Redes del centro de datos

Simplifique las operaciones y asegure la confiabilidad con el centro de datos automatizado y moderno. Juniper lo ayuda a automatizar y validar continuamente todo el ciclo de vida de la red, para facilitar el diseño, el despliegue y las operaciones.

Interconector del centro de datos

Las soluciones DCI de Juniper permiten generar una interconectividad sin interrupciones que supera las limitaciones de escalabilidad tradicionales, el bloqueo de proveedores y los desafíos de interoperabilidad.

Arquitectura de enrutamiento óptico convergente (CORA)

La CORA es una solución automatizada, sostenible y extensible para la convergencia óptica a través de IP. Proporciona los componentes esenciales que los operadores necesitan para implementar estrategias transformadoras de IP a través de MDCLO para las redes 400G y más allá en redes de núcleo, borde y área metropolitana.

Redes de almacenamiento de IP

Simplifique su almacenamiento de datos e impulse el rendimiento del centro de datos con redes de almacenamiento de todas las IP. Utilice las últimas tecnologías, como NVMe/RoCEv2 con conmutación de 100G o 400G, o NVMe/TCP, para crear un almacenamiento de alto rendimiento o convergir su almacenamiento y sus datos en una sola red.

ÉXITO DEL CLIENTE

SambaNova hace que el aprendizaje automático de alto rendimiento y vinculado a la CPU sea fácil y escalable.

La IA promete transformar la atención médica, los servicios financieros, la fabricación, la venta minorista y otras industrias, pero muchas organizaciones que buscan mejorar la velocidad y la efectividad de los esfuerzos humanos aún no han alcanzado el potencial completo de la IA.

Para superar la complejidad de desarrollar el aprendizaje automático (ML) complejo y vinculado a la CPU, SambaNova diseñó DataScale. Diseñado a partir de la arquitectura Dataflow reconfigurable (RDA) de SambaNova Systems y construido mediante estándares abiertos e interfaces de usuario, DataScale es una plataforma de sistemas de software y hardware integrada optimizada de algoritmos a chips. La conmutación de Juniper mueve volúmenes masivos de datos para los sistemas y servicios de escala de datos de SambaNova.  

Imagen de SambaNova

Preguntas frecuentes de redes del centro de datos de IA

¿Qué tipos de empresas están priorizando el despliegue de soluciones de IA/ML en sus centros de datos hoy?

La demanda de IA está impulsando a los hiperescaladores, los proveedores de nube, las empresas, los gobiernos y las instituciones educativas a incorporar IA en sus sistemas comerciales para automatizar las operaciones, generar contenido y comunicaciones y mejorar el servicio al cliente.

¿Cuál es la diferencia entre las etapas de entrenamiento e inferencia de IA?

Los modelos de IA se construyen utilizando conjuntos de datos cuidadosamente diseñados durante la etapa de capacitación. El entrenamiento sucede en diversos GPU y abarca decenas, cientos e incluso miles de GPU en un grupo, todos conectados en una red y constantemente intercambiando datos entre sí. Después de esta etapa de capacitación, el modelo está esencialmente completo. Durante la etapa de inferencia, los usuarios interactúan con el modelo, que puede reconocer imágenes o generar imágenes y texto para proporcionar respuestas a las preguntas de los usuarios. El entrenamiento es típicamente una operación sin conexión, mientras que la inferencia generalmente es en línea.

¿Cuáles son los componentes de la solución de infraestructura de red de centro de datos de IA y cómo los habilita Juniper?

Los conjuntos de datos masivos de IA están creando la necesidad de una mayor potencia informática, un almacenamiento más rápido y redes de alta capacidad y baja latencia. Juniper ayuda a satisfacer estos requisitos de las siguientes maneras:

  • Cómputo: los clústeres de computación de IA/ML generan enormes requisitos en la red entre nodos. Reducir el tiempo de culminación del trabajo (JCT) es esencial y la red juega un papel clave en la operación eficiente del grupo. Juniper ofrece una gama de conmutadores no bloqueantes de alto rendimiento con capacidad de búfer profundo y administración de congestión que, cuando se diseñan de manera óptima, eliminan cualquier demora de la red.
  • Almacenamiento: en los grupos de IA/ML y la computación de alto rendimiento, rara vez se puede almacenar un conjunto o modelo completo de datos en los nodos de cálculo, por lo que se requiere una red de almacenamiento de alto rendimiento. Los conmutadores de la serie QFX de Juniper se pueden usar para la conectividad de almacenamiento IP; ofrecen soporte completo para redes de acceso directo de memoria remota (RDMA), incluida la memoria no volátil Express/RDMA sobre Ethernet convergente (NVMe/RoCE) y el sistema de archivos de red (NFS) o RDMA.
  • Red: los modelos de entrenamiento de IA implican cálculos grandes e intensos distribuidos en cientos o miles de procesadores de CPU, GPU y TPU. Estos cálculos exigen redes de alta capacidad, escalables horizontalmente y sin errores. Los conmutadores QFX de Juniper y los enrutadores serie PTX admiten estos cálculos dentro y a lo largo de los centros de datos con una transferencia de datos de conmutación y enrutamiento líder en la industria y capacidades de interconector del centro de datos (DCI).

¿Cómo simplifica el centro de datos de IA de Juniper las operaciones en el centro de datos?

Apstra es la plataforma líder de Juniper para la automatización de centro de datos y garantía.   Automatiza todo el ciclo de vida de la red, desde el diseño hasta las operaciones rutinarias, en todos los centros de datos de los diversos proveedores con validación continua, análisis potente e identificación de la causa raíz para asegurar fiabilidad.  Con Marvis VNA para centro de datos, esta información se trae desde Apstra a la nube de Juniper Mist y se presenta en un panel de control de VNA común para información de extremo a extremo.  Marvis VNA para centro de datos también proporciona una interfaz de conversación sólida (usando GenAI) para simplificar drásticamente las consultas a la base de conocimiento.  

¿Cómo aborda la solución de redes del centro de datos de IA de Juniper los requisitos de administración de congestión, equilibrio de carga y latencia para maximizar el rendimiento de IA?

Los conmutadores de centro de datos no bloqueantes de alto rendimiento de Juniper ofrecen administración de congestión y búfer profundo para eliminar los cuellos de botella de red. Para equilibrar las cargas de tráfico, admitimos el equilibrio de carga dinámico y el enrutamiento adaptativo. Para la administración de congestión, Juniper admite completamente la notificación de congestión cuantificada del centro de datos (DCQCN), el control de flujo de prioridad (PFC) y la notificación de congestión explícita (ECN). Finalmente, para reducir la latencia, Juniper usa las mejores arquitecturas de chip comercial y ASIC personalizadas que maximizan los búferes cuando se necesitan, las colas de salida virtual (VOQ) y las estructuras basadas en células dentro de nuestras arquitecturas de spine.

¿Qué ofrece Juniper para el almacenamiento IP?

Nuestra cartera incluye conmutadores abiertos basados en estándares que ofrecen conectividad de almacenamiento basada en IP mediante NVMe/RoCE o NFS/RDMA (consulte las preguntas frecuentes anteriores). Nuestros diseños de solución de redes de almacenamiento IP pueden escalar desde una configuración pequeña de cuatro nodos a cientos o miles de nodos de almacenamiento.