英伟达发布 Groq 3 LPX 机架系统:集成 256 颗 LP30 芯片,片上 SRAM 合计 128GB

英伟达在 GTC 2026 发布 Groq 3 LPX 机架,面向低延迟与长上下文的智能体系统,定位为 Vera Rubin 的 AI 推理加速器。机架采用全液冷、基于 MGX 架构,包含 32 个 1U 计算托盘、每托盘 8 颗 LP30(共 256 颗),片上 SRAM 合计 128GB、带宽约 40PB/s;每颗芯片有 96 条 112Gbps 的 C2C 链路,托盘可通过头节点 CPU 扩展至 384GB DRAM。英伟达宣称该平台能显著提升解码速度并降低延迟,使 Vera Rubin 每兆瓦推理吞吐量提升约 35 倍,并为万亿参数模型带来多达 10 倍的营收机会,产品预计今年下半年上市。

3 月 17 日消息,英伟达当地时间昨日在 GTC 2026 上发布了 Groq 3 LPX 机架。这一机架专为智能体系统的低延迟和长上下文需求而设计,定位 Vera Rubin 的 AI 推理加速器,预计将在今年下半年面世。

Groq 3 LPX 机架架构采用全液冷设计,并基于 MGX 基础设施构建。其拥有 32 个 1U 计算托盘,每个托盘中配备 8 颗 Groq 3 (LP30) 芯片,每颗 LPU 拥有 500MB 的片上 SRAM。

因此,整个 Groq 3 LPX 机架集成了 256 颗 LP30 芯片片上 SRAM 合计 128 GB,这对应 40PB/s 的 SRAM 带宽,显著提升解码(IT之家注:输出生成)速度、降低响应延迟。

此外,每个 Groq 3 (LP30) LPU 芯片 96 条 112Gbps C2C 链路连接至系统其它部分,单一托盘通过结构扩展逻辑和头节点 CPU 可扩展合计 384GB 的 DRAM 内存,以满足系统互联的需求,在片上 SRAM 不足以覆盖任务需求时提供后援支持。

英伟达表示,Groq 3 LPX 的加入使得 Vera Rubin 平台每兆瓦的推理吞吐量提升高达 35 倍,并为万亿参数模型带来了多达 10 倍的营收机遇。

英伟达 GTC 2026 大会专题

版权声明:本站文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!

评论加载中...