英伟达发布 Groq 3 LPX 机架系统：集成 256 颗 LP30 芯片，片上 SRAM 合计 128GB

英伟达在 GTC 2026 发布 Groq 3 LPX 机架，面向低延迟与长上下文的智能体系统，定位为 Vera Rubin 的 AI 推理加速器。机架采用全液冷、基于 MGX 架构，包含 32 个 1U 计算托盘、每托盘 8 颗 LP30（共 256 颗），片上 SRAM 合计 128GB、带宽约 40PB/s；每颗芯片有 96 条 112Gbps 的 C2C 链路，托盘可通过头节点 CPU 扩展至 384GB DRAM。英伟达宣称该平台能显著提升解码速度并降低延迟，使 Vera Rubin 每兆瓦推理吞吐量提升约 35 倍，并为万亿参数模型带来多达 10 倍的营收机会，产品预计今年下半年上市。

3 月 17 日消息，英伟达当地时间昨日在 GTC 2026 上发布了 Groq 3 LPX 机架。这一机架专为智能体系统的低延迟和长上下文需求而设计，定位 Vera Rubin 的 AI 推理加速器，预计将在今年下半年面世。

Groq 3 LPX 机架架构采用全液冷设计，并基于 MGX 基础设施构建。其拥有 32 个 1U 计算托盘，每个托盘中配备 8 颗 Groq 3 (LP30) 芯片，每颗 LPU 拥有 500MB 的片上 SRAM。

因此，整个 Groq 3 LPX 机架集成了 256 颗 LP30 芯片，片上 SRAM 合计 128 GB，这对应 40PB/s 的 SRAM 带宽，显著提升解码（IT之家注：输出生成）速度、降低响应延迟。

此外，每个 Groq 3 (LP30) LPU 芯片 96 条 112Gbps C2C 链路连接至系统其它部分，单一托盘通过结构扩展逻辑和头节点 CPU 可扩展合计 384GB 的 DRAM 内存，以满足系统互联的需求，在片上 SRAM 不足以覆盖任务需求时提供后援支持。

英伟达表示，Groq 3 LPX 的加入使得 Vera Rubin 平台每兆瓦的推理吞吐量提升高达 35 倍，并为万亿参数模型带来了多达 10 倍的营收机遇。

英伟达 GTC 2026 大会专题