面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN

面壁智能联合清华大学与 OpenBMB 开源社区，发布并开源了 BitCPM-CANN——中国首个完全基于华为昇腾算力端到端训练的三值（1.58-bit）大模型系列。该系列包含 0.5B、1B、3B、8B 四种尺寸，训练与量化算子、算法、全链路框架均在昇腾上原生实现。相比 BF16 精度，推理阶段可释放约 6 倍显存，模型性能保留率为 90%–97.2%，官方称 8B 模型可在主流旗舰手机上运行；同时基于 MindSpeed × Megatron-LM 构建了完整的低比特训练底座并开源，模型权重已在 HuggingFace 与 ModelScope 上线。

5 月 25 日消息，面壁智能联合清华大学、OpenBMB 开源社区，今天正式发布并开源其在低比特大模型训练方向的最新成果 ——BitCPM-CANN。

官方表示，这是中国首个完全基于国产算力平台（华为昇腾）实现端到端训练并开源的三值（1.58-bit）大模型。从量化算子、训练算法到全链路框架，BitCPM-CANN 均在华为昇腾上原生完成，包含 0.5B、1B、3B、8B 四个模型尺寸，与同尺寸 MiniCPM4 全精度家族逐项对照评测，性能表现优异。

相比传统 BF16 精度，BitCPM-CANN 在推理阶段释放约 6 倍显存红利，同时将模型能力保留率维持在 90%– 97.2 %。

官方表示，对手机产业来说，6 倍的显存红利意味着，一个 8B 参数的 BitCPM-CANN 大模型，可以轻松运行在当前主流旗舰手机之上。

此外，面壁智能基于 MindSpeed × Megatron-LM 主干搭建了完整的低比特训练底座，包含环境适配、32K 长序列支持、并行策略、融合算子等完整工程体系。从此，所有面向昇腾的低比特训练工作，都可建立在同一套公共基础设施之上。

BitCPM-CANN 0.5B / 1B / 3B / 8B 全系列模型权重现已开源，IT之家附链接如下：

HuggingFace：https://huggingface.co/collections/openbmb/bitcpm-cann
ModelScope：https://modelscope.cn/collections/OpenBMB/BitCPM-CANN