首页 产业新闻 亚马逊云科技推出配备72个英伟达Blackwell GPU的新实例 算力提升20倍

亚马逊云科技推出配备72个英伟达Blackwell GPU的新实例 算力提升20倍

产业新闻 80

    7月10日消息,为了加速推理模型、Agentic AI系统等新兴生成式AI技术的发展,亚马逊云科技宣布由NVIDIA Grace Blackwell Superchips加速的_Amazon EC2 P6e-GB200 UltraServer_现已正式可用。P6e-GB200 UltraServer专为训练和部署最大规模、最复杂的AI模型而设计。

    今年早些时候,亚马逊云科技已推出了基于NVIDIA Blackwell GPU的Amazon EC2 P6-B200实例,支持多样化的AI和高性能计算工作负载。

    Amazon EC2 P6e-GB200 UltraServer是亚马逊云科技迄今为止最强大的GPU产品,配备最多72个NVIDIA Blackwell GPU,这些GPU通过第五代NVIDIA NVLink互连,并作为单一计算单元运行。每台UltraServer可提供高达360 petaflops的高密度FP8算力,以及13.4TB的高带宽显存(HBM3e)——相比P5en实例,在单个NVLink域内的计算能力提升超过20倍,内存容量提升超过11倍。Amazon EC2 P6e-GB200 UltraServer支持高达28.8 Tbps的第四代Elastic Fabric Adapter(EFAv4)网络带宽。

    Amazon EC2 P6-B200实例为广泛AI场景提供灵活选择。每个实例配备8个通过NVLink互连的NVIDIA Blackwell GPU,拥有1.4TB高带宽显存和最高3.2 Tbps的EFAv4网络带宽,以及第五代Intel Xeon Scalable处理器。与Amazon EC2 P5en实例相比,Amazon EC2 P6-B200实例的GPU计算能力是其2.25倍,显存容量为其1.27倍,显存带宽为其1.6倍。

    目前,亚马逊云科技通过多种部署路径简化Amazon EC2 P6e-GB200 UltraServer和Amazon EC2 P6-B200实例的启用过程,客户可快速开始使用Blackwell GPU,同时保持其现有的运维模式。

    Amazon SageMaker HyperPod将支持Amazon EC2 P6e-GB200 UltraServer和Amazon EC2 P6-B200实例,并通过优化使工作负载保持在同一NVLink域内,以实现性能最大化。亚马逊云科技还在构建一套完整的多层级恢复机制:Amazon SageMaker HyperPod可在同一NVLink域内自动用预配置的备用实例替换故障节点。内置仪表板将提供从GPU利用率、内存使用情况到工作负载指标和UltraServer运行状态的全面可视化信息。

    同时,Amazon EC2 P6e-GB200 UltraServer也将通过NVIDIA DGX Cloud提供。DGX Cloud是一个统一的AI平台,在各层架构均经过优化,具备多节点AI训练与推理能力,并集成英伟达完整的AI软件栈。客户可充分利用英伟达最新的性能优化方案、基准测试方法和技术专长,以提升效率与性能。该平台还提供灵活的服务期限选择,以及由英伟达专家提供的全面支持与服务,助力客户加速推进AI项目。