智谱 GLM-5.1“Day0”上线华为云，在昇腾算力上实现 Layer 级 MOE 绝对均衡

智谱发布新一代旗舰模型 GLM-5.1，并在华为云上线“Day0”版本。GLM-5.1 在昇腾算力上实现 Layer 级 MOE 绝对均衡，结合框架与硬件协同优化提升算力均衡与 HBM 访存性能，华为云通过系统级优化使推理整体吞吐提升约30%。华为云 MaaS 提供免部署的一键调用 Tokens 服务，ModelArts 支持一键部署推理服务（公共池与专属池）。官方称 GLM-5.1 为目前最强开源模型，可持续工作8小时，并在 SWE-bench Pro 基准上首次超越 Opus 4.6。

4 月 8 日消息，智谱今天正式发布新一代旗舰模型 GLM-5.1。华为官方宣布，智谱 GLM-5.1“Day0”上线华为云。

据介绍，智谱 GLM-5.1 在昇腾算力上实现了 Layer 级 MOE 绝对均衡，通过框架能力优化让专家均衡产出 Token，同时结合昇腾 Attention 算子特征，通过推理框架和硬件协同的定向优化，提升算力均衡和 HBM 访存均衡能力。华为云通过系统级优化，实现推理加速，整体吞吐提升 30%。

当前，华为云 MaaS 模型即服务平台已为开发者提供免部署、一键调用智谱 GLM-5.1 API 的 Tokens 服务，支持在线体验。企业也可通过华为云魔坊（ModelArts）模型训推平台，一键完成推理服务部署上线，支持公共池和专属池两种资源部署方式，满足独占和非独占算力的使用诉求。

据IT之家今日早些时候报道，智谱 GLM-5.1 号称目前全球最强的开源模型。官方表示，其是唯一达到 8 小时级持续工作的开源模型，在最接近真实软件开发的 SWE-bench Pro 基准测试中，GLM-5.1 实现国产模型首次超越 Opus 4.6。

相关阅读：

《智谱发布可持续工作 8 小时的旗舰模型 GLM-5.1，同时提价 10%》