Tensordyne Napier 流片:宣称平台 AI 推理吞吐 13 倍于 Blackwell 系统

北美-欧洲 AI 芯片初创公司 Tensordyne 于 6 月 15 日发布 AI 推理系统 Tensordyne Napier (TDN),宣称相比 NVIDIA Blackwell 系统在按 Token 能效上提升 17 倍、吞吐量提升 13 倍。Napier 芯片已流片并采用台积电 3nm 工艺,采用对数数学设计以用加法替代大规模乘法,集成大量 SRAM 缓存与 HBM,处理器间通信延迟<1μs。基于 Napier 构建的 TDN72“推理舱”集成 72 颗算力芯片,单机柜可容纳 4 舱(288 芯片),机架级系统可实现 T 级 LLM 推理(1000 Token/s/user),并宣称每年可带来约 3300 万美元的额外收入。

6 月 16 日消息,北美-欧洲 AI 芯片初创企业 Tensordyne 当地时间 15 日宣布推出 AI 推理系统 Tensordyne Napier (TDN),宣称其可实现 NVIDIA Blackwell 系统 17 倍的按 Token(词元)计能效和 13 倍的吞吐量

TDN 平台由 Tensordyne 与博通、HPE 瞻博网络合作开发。其核心 Napier 处理器已成功流片,正以台积电 3nm 制程工艺生产。

IT之家了解到,Napier 芯片采用对数数学设计,这意味着可用更简单的加法运算替代 AI 推理中的大规模乘法操作;此外其芯片集成大量 SRAM 缓存和 HBM 内存,处理器间通信延迟<1μs。

基于 Napier,Tensordyne 构建了集成 72 颗算力芯片 TDN 的 TDN72“推理舱”,而一个机架 / 机柜可容纳四个“推理舱”,从而集成 288 颗芯片。机架级 TDN 系统可以 1000 Token/s/user 的速率进行 T 级 LLM 推理,每年额外创造多达 3300 万美元的收入。

版权声明:本站文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!

评论加载中...