AI 데이터센터 네트워킹

최근 생성형 AI가 전 세계 수억 명 사람들의 상상력을 사로잡으면서 AI와 머신러닝(ML)이 기업들의 집중 조명을 받게 되었습니다. 데이터센터는 AI를 뒷받침하는 엔진으로서, 데이터센터 네트워크는 AI 교육 데이터센터에서 컴퓨팅 집약적 작업의 처리를 수행하는 고가의 GPU 서버를 상호 연결하고 활용도를 극대화하는 데 있어 중요한 역할을 합니다.

AI/ML 워크로드에 최적화된 데이터센터 네트워크에는 AI 모델링 성능과 경제성을 최적화하기 위해 혼잡 관리, 로드 밸런싱 등과 관련한 특별한 기능이 필요합니다. 주니퍼 솔루션은 확장 가능하고 병목 현상 없는 대용량 네트워킹 패브릭으로 최고의 AI 성능을 제공함으로써 이러한 요구 사항을 충족합니다.

Modern high rise building with sky view

AI의 경제성 향상

AI 교육의 경제성은 빠르고 간단하며 지능적인 고급 네트워킹에 달려 있습니다.

자세히 보기

주니퍼 솔루션의 강점

주니퍼는 부단한 혁신을 통해 확장성과 성능 및 사용자 경험을 새로운 차원으로 업그레이드합니다. 주니퍼의 AI 네트워킹 솔루션을 통해 고객은 확장 가능하고 운영이 용이한 대용량 네트워크 패브릭을 구축하여 GPU 활용도를 극대화하고 경제성을 향상하면서 가장 빠른 작업 완료 시간(JCT)을 달성할 수 있습니다.

Technology iot concept.

고성능 AI 패브릭

GPU 활용도를 극대화하고 유휴 시간을 최소화하는 것은 AI 모델을 교육하는 데 있어 중요한 경제적 요소입니다. 주니퍼 AI 네트워킹 솔루션은 고정된 폼 팩터와 하이래딕스 스위치에 주니퍼의 광범위한 실리콘 포트폴리오를 결합하여 활용함으로써 작업 완료 시간(JCT)을 최적화하고 꼬리 지연 시간을 최소화합니다. 이 솔루션은 전력 사용 효율성과 확장성 등의 요소에 최적화되어 있으며 다양한 사용 사례에 유연하게 적용할 수 있습니다.

Business intelligence analyst dashboard on virtual screen. Big data Graphs Charts.

개방형 표준 기반 솔루션

기업을 종속시키는 소유권 독점 솔루션은 AI 혁신을 방해할 수 있습니다. 주니퍼는 혁신을 촉진하고 비용을 절감하는 탄탄한 벤더 에코시스템을 통해 데이터센터 네트워크의 이더넷 표준을 강력히 지원합니다. 주니퍼는 또한 주니퍼 Apstra 인텐트 기반 패브릭 관리 및 자동화 소프트웨어를 활용하면서 멀티벤더 데이터센터 운영을 지원하는 데 최선을 다하고 있습니다.

Electronic circuit board and digital information technology concept.

경험 최우선 방식의 운영

데이터센터 네트워크가 점점 더 복잡해지면서 AI 워크로드 성능 요구 사항을 충족할 수 있는 새로운 프로토콜이 필요합니다. 주니퍼의 Junos 운영체제와 주니퍼 Apstra 데이터센터 관리 소프트웨어로 자동화하면 네트워크 운영자를 이러한 복잡성으로부터 보호할 수 있고 멀티벤더 경험 최우선 방식으로 데이터센터 운영을 간소화할 수 있습니다.

관련 솔루션

데이터센터 네트워크

현대적인 자동화된 데이터센터를 통해 운영을 간소화하고 신뢰성을 보장합니다. 주니퍼는 고객이 쉽게 디자인, 구축 및 운영할 수 있도록 전체 네트워크 라이프사이클의 자동화 및 지속적인 검증을 지원합니다.

DCI(Data Center Interconnect)

주니퍼의 DCI 솔루션은 기존의 확장성 제한, 벤더 이전 어려움 및 상호 운용성 과제를 해결하는 원활한 상호 연결성을 지원합니다.

CORA(Converged Optical Routing Architecture)

CORA는 IP-옵티컬 컨버전스를 위한 확장 가능하고 지속 가능한 자동화 솔루션입니다. 이 솔루션은 메트로, 에지 및 코어 네트워크에서 400G 네트워킹과 그 이상을 위한 IP-over-DWDM 전환 전략을 배포하기 위해 사업자에게 필요한 필수적인 기본 구성 요소를 제공합니다.

IP 스토리지 네트워킹

IP 기반 스토리지 네트워크로 데이터 스토리지를 간소화하고 데이터센터 성능을 향상할 수 있습니다. 100G/400G 스위칭의 NVMe/RoCEv2 또는 NVMe/TCP와 같은 최신 기술을 사용하면 고성능 스토리지를 구축하거나 스토리지와 데이터를 하나의 단일 네트워크에 통합할 수 있습니다.

고객 성공

SambaNova는 고성능 및 컴퓨팅 기반 머신러닝을 쉽고 확장 가능하게 만듭니다

AI는 의료기관, 금융 서비스, 제조업, 유통 및 기타 업계를 혁신할 것이지만 인간 노력의 속도와 효과를 개선하려는 많은 조직은 아직 AI의 완전한 잠재력에 도달하지 못했습니다.

복잡한 컴퓨팅 기반 머신러닝(ML) 구축의 복잡성을 극복하기 위해 SambaNova는 DataScale을 설계했습니다. SambaNova 시스템의 RDA(가변구조형 데이터 플로우 아키텍처)를 사용하고 개방형 표준 및 사용자 인터페이스를 사용하여 구축된 DataScale은 알고리즘에서 실리콘까지 최적화된 통합 소프트웨어 및 하드웨어 시스템 플랫폼입니다. 주니퍼 스위칭은 SambaNova의 Datascale 시스템 및 서비스에 필요한 방대한 양의 데이터를 처리합니다.  

SambaNova 이미지

AI 데이터센터 네트워킹 FAQ

오늘날 데이터센터에서 AI/ML 솔루션 구축을 우선시하는 기업은 어떤 유형인가요?

AI 수요로 인해 하이퍼스케일러, 클라우드 프로바이더, 대기업, 정부 및 교육 기관은 비즈니스 시스템에 AI를 도입하여 운영을 자동화하고, 컨텐츠와 커뮤니케이션을 생성하며, 고객 서비스를 향상하고 있습니다.

AI의 트레이닝 단계와 추론 단계의 차이점은 무엇인가요?

AI 모델은 트레이닝 단계에서 신중하게 제작된 데이터 세트를 사용하여 구축됩니다. 교육은 한 개 클러스터에 포함된 수십, 수백, 심지어 수천 개 GPU에 달하는 여러 GPU에서 이루어지는데, 네트워크 전체에서 모두 연결되어 있고 계속해서 서로 데이터를 주고받습니다. 이 트레이닝 단계가 끝나면 모델은 기본적으로 완료된 것입니다. 추론 단계에서는 사용자들이 모델과 상호 작용하는데, 모델은 이미지를 인식하거나 그림과 텍스트를 생성하면서 사용자 질문에 답변을 제공합니다. 트레이닝은 보통 오프라인 작업인 반면, 추론은 일반적으로 온라인에서 이루어집니다.

AI 데이터센터 네트워크 인프라 솔루션의 구성 요소는 무엇이며, 주니퍼는 이러한 구성 요소를 어떻게 지원하나요?

막대한 양의 AI 데이터 세트로 인해 더욱 강력한 컴퓨팅 성능, 더욱 신속한 저장, 대용량 저지연 네트워킹 등이 필요합니다. 주니퍼는 다음과 같은 방식으로 이러한 요구 사항을 충족할 수 있게 지원합니다.

  • 컴퓨팅: AI/ML 컴퓨팅 클러스터로 인해 노드 간 네트워크의 요구 사항이 까다롭습니다. 작업 완료 시간(JCT)을 단축하는 것이 필수적인데, 효율적인 클러스터 운영에 있어 네트워크는 핵심적인 역할을 합니다. 주니퍼는 고성능 논블로킹 스위치를 다양하게 제공하고 있으며, 이러한 제품은 딥 버퍼 기능과 혼잡 관리 기능을 갖추고 있어 최적으로 설계될 경우 네트워크의 모든 병목 현상을 제거해 줍니다.
  • 스토리지: AI/ML 클러스터와 고성능 컴퓨팅에서 전체 데이터 세트 또는 모델을 컴퓨팅 노드에 저장할 수 있는 경우는 거의 없기 때문에 고성능 스토리지 네트워크가 필요합니다. IP 스토리지 연결에는 주니퍼 QFX 시리즈 스위치를 사용할 수 있습니다. 이 스위치는 NVMe(Non-Volatile Memory Express)/컨버지드 이더넷을 통한 RDMA(RoCE) 및 네트워크 파일 시스템(NFS)/RDMA를 포함하여 RDMA(Remote Direct Memory Access) 네트워킹을 완벽하게 지원합니다.
  • 네트워크: AI 트레이닝 모델에서는 수백 또는 수천 개의 분산된 CPU, GPU 및 TPU 프로세서에 걸쳐 대용량의 집중적인 컴퓨팅 작업이 수행됩니다. 이러한 컴퓨팅 작업으로 인해 수평적 확장이 가능하고 오류가 없는 고용량 네트워크가 필요합니다. 주니퍼 QFX 스위치PTX 시리즈 라우터는 업계 최고의 스위칭 및 라우팅 처리량과 DCI(Data Center Interconnect) 기능을 바탕으로 이러한 대용량 컴퓨팅 작업을 지원합니다.

주니퍼 AI 데이터센터 네트워킹 솔루션은 AI 성능을 극대화하는 데 필요한 혼잡 관리, 로드 밸런싱 및 저지연 요구 사항을 어떻게 해결하나요?

주니퍼의 고성능 논블로킹 데이터센터 스위치는 딥 버퍼링 및 혼잡 관리 기능을 제공하여 네트워크 병목 현상을 제거합니다. 트래픽 로드의 균형을 맞추기 위해 주니퍼는 동적 로드 밸런싱과 적응형 라우팅을 지원합니다. 혼잡 관리를 위해 주니퍼는 양자화 방식의 데이터센터 혼잡 알림(DCQCN), 우선순위 기반 플로우 제어(PFC) 및 명시적 혼잡 알림(ECN)을 완전히 지원합니다. 마지막으로, 지연을 줄이기 위해 주니퍼는 필요한 곳에서 버퍼를 극대화하는 동종 최강의 상용 실리콘 및 맞춤형 ASIC 아키텍처, 가상 출력 대기열(VOQ), 스파인 아키텍처 내의 셀 기반 패브릭 등을 활용합니다.

IP 스토리지를 위해 주니퍼는 어떤 기능을 제공하나요?

주니퍼의 포트폴리오에는 NVMe/RoCE 또는 NFS/RDMA를 사용하여 IP 기반 스토리지 연결을 제공하는 표준 기반의 개방형 스위치가 포함되어 있습니다(이전 FAQ 참조). 주니퍼의 IP 스토리지 네트워킹 솔루션 설계는 4개 노드의 소규모 구성부터 수백 또는 수천 개 스토리지 노드까지 확장할 수 있습니다.