华为 Atlas 350 加速卡上市，搭载全新昇腾 950PR 处理器

报道介绍华为在2026年合作伙伴大会上发布了搭载全新昇腾950PR处理器的Atlas 350加速卡，面向推荐推理、多模态生成与大模型推理三大场景。昇腾950PR在算力、访存与编程模式上有微架构升级，支持FP4低精度；单卡FP4算力1.56P、宣称为英伟达H20的2.87倍，HBM容量112GB（为H20的1.16倍）、带宽约1.4TB/s，功耗600W，内存访问颗粒度从512B降至128B以提升小算子访存效率。多家合作伙伴已发布基于Atlas 350的整机产品，面向行业客户提供定制化推理解决方案。

3 月 21 日消息，3 月 20 日，在华为中国合作伙伴大会 2026 期间，昇腾人工智能伙伴峰会成功举办。华为副总裁、ICT 产品组合管理与解决方案部总裁马海旭宣布搭载全新昇腾 950PR（Ascend 950PR）处理器的 Atlas 350 加速卡正式上市。

IT之家从官方介绍获悉，该加速卡搭载了全新的昇腾 950PR 处理器，算力与内存双升级、访存更灵活、开发更易用。面向推荐推理、多模态生成和 LLM 推理三大场景，伙伴可以基于 Atlas 350 打造更具竞争力的产品和解决方案。

昆仑、华鲲振宇、神州鲲泰、长江计算、宝德、软通华方、百信七家核心伙伴正式发布基于昇腾 Atlas350 的整机产品，共同面向行业客户打造定制化、高性能的推理解决方案。

作为昇腾 950 代际首款上市的硬件产品，昇腾 Atlas 350 采用全新昇腾 950PR （Ascend 950PR）处理器，在算力、访存、编程模式等微架构层面实现显著升级。

另据上海证券报报道，华为昇腾计算业务总裁张迪煊介绍，Atlas 350 的单卡算力达到了英伟达 H20 的 2.87 倍，是目前国内唯一支持 FP4 低精度的推理产品；HBM（高带宽内存）容量是 H20 的 1.16 倍，达到了 112GB，多模态生成速度可以提升 60%；内存访问颗粒度从 512 字节减少到 128 字节，小算子访存效率提升 4 倍。

在大会展厅 Atlas 350 展台，上证报记者看到了 Atlas 350 的具体参数：Atlas 350 的 FP4 精度算力为 1.56P，带宽达到了 1.4TB/s；功耗为 600W，是 H20 的 1.5 倍。