首页产业新闻亚马逊云科技推出配备72个英伟达Blackwell GPU的新实例算力提升20倍

亚马逊云科技推出配备72个英伟达Blackwell GPU的新实例算力提升20倍

产业新闻 12个月前 (07-10) 243

7月10日消息，为了加速推理模型、Agentic AI系统等新兴生成式AI技术的发展，亚马逊云科技宣布由NVIDIA Grace Blackwell Superchips加速的_Amazon EC2 P6e-GB200 UltraServer_现已正式可用。P6e-GB200 UltraServer专为训练和部署最大规模、最复杂的AI模型而设计。

今年早些时候，亚马逊云科技已推出了基于NVIDIA Blackwell GPU的Amazon EC2 P6-B200实例，支持多样化的AI和高性能计算工作负载。

Amazon EC2 P6e-GB200 UltraServer是亚马逊云科技迄今为止最强大的GPU产品，配备最多72个NVIDIA Blackwell GPU，这些GPU通过第五代NVIDIA NVLink互连，并作为单一计算单元运行。每台UltraServer可提供高达360 petaflops的高密度FP8算力，以及13.4TB的高带宽显存（HBM3e）——相比P5en实例，在单个NVLink域内的计算能力提升超过20倍，内存容量提升超过11倍。Amazon EC2 P6e-GB200 UltraServer支持高达28.8 Tbps的第四代Elastic Fabric Adapter（EFAv4）网络带宽。

Amazon EC2 P6-B200实例为广泛AI场景提供灵活选择。每个实例配备8个通过NVLink互连的NVIDIA Blackwell GPU，拥有1.4TB高带宽显存和最高3.2 Tbps的EFAv4网络带宽，以及第五代Intel Xeon Scalable处理器。与Amazon EC2 P5en实例相比，Amazon EC2 P6-B200实例的GPU计算能力是其2.25倍，显存容量为其1.27倍，显存带宽为其1.6倍。

目前，亚马逊云科技通过多种部署路径简化Amazon EC2 P6e-GB200 UltraServer和Amazon EC2 P6-B200实例的启用过程，客户可快速开始使用Blackwell GPU，同时保持其现有的运维模式。

Amazon SageMaker HyperPod将支持Amazon EC2 P6e-GB200 UltraServer和Amazon EC2 P6-B200实例，并通过优化使工作负载保持在同一NVLink域内，以实现性能最大化。亚马逊云科技还在构建一套完整的多层级恢复机制：Amazon SageMaker HyperPod可在同一NVLink域内自动用预配置的备用实例替换故障节点。内置仪表板将提供从GPU利用率、内存使用情况到工作负载指标和UltraServer运行状态的全面可视化信息。

同时，Amazon EC2 P6e-GB200 UltraServer也将通过NVIDIA DGX Cloud提供。DGX Cloud是一个统一的AI平台，在各层架构均经过优化，具备多节点AI训练与推理能力，并集成英伟达完整的AI软件栈。客户可充分利用英伟达最新的性能优化方案、基准测试方法和技术专长，以提升效率与性能。该平台还提供灵活的服务期限选择，以及由英伟达专家提供的全面支持与服务，助力客户加速推进AI项目。

亚马逊云科技推出配备72个英伟达Blackwell GPU的新实例算力提升20倍

相关推荐

热门文章

侧栏广告

文章目录

标签列表

亚马逊云科技推出配备72个英伟达Blackwell GPU的新实例 算力提升20倍

相关推荐

热门文章

侧栏广告

文章目录

标签列表

亚马逊云科技推出配备72个英伟达Blackwell GPU的新实例算力提升20倍