关于本文档
本文档描述了连接 AMD MI300X GPU 服务器和 Vast Storage 系统的AI群集基础架构的设计要求和实施,该基础架构基于经过AI优化的 瞻博网络 数据中心瞻博网络交换机,由 Juniper Apstra 和 Terraform 自动化配置和管理。作为该解决方案的一部分,Broadcom Thor2 和 AMD Pollara 网络接口卡 (NIC) 都经过了兼容性和性能验证。
所有验证测试均在美国加州森尼维尔的瞻博网络 AI 创新实验室证书颁发机构进行。在这个开放实验室中,瞻博网络与客户和技术合作伙伴密切合作,共同开发 AI 解决方案,并针对一系列 AI 应用和模型测试部署。
AI 创新实验室允许客户看到在 AMD GPU 和 VAST 存储群集上运行的 AI 训练和推理。瞻博网络运行客户特定的模型以及来自 MLCommons 的模型来执行这些测试,以进行 MLPerf 性能基准测试和比较。
注意:为简洁起见,AMD Pensando Pollara 400 NIC 在本文档中将称为 AMD Pollara NIC。