面壁智能开源 MiniCPM5-1B:在 AA-Index 上超越所有 2B 参数以下模型,能跑在手机、浏览器上

面壁智能联合清华大学与 OpenBMB 开源社区开源发布了端侧文本基座大模型 MiniCPM5-1B(1B 参数)。官方称该模型在 AA-Index 上超过了所有 2B 参数以下模型,相比三个月前的 Qwen3.5-2B 在效果上更优且参数量减半。模型经 INT4 量化后权重约 0.5GB,可在手机与浏览器上运行;Base 版由面壁智能自研的 ForgeTrain 预训练完成。模型权重、训练数据与部署方案已全面开源,并提供了多个下载与镜像链接。

5 月 26 日消息,面壁智能今日联合清华大学、 OpenBMB 开源社区正式发布并开源最新一代端侧文本基座大模型 ——MiniCPM5-1B

官方表示,MiniCPM5-1B 仅以 1B 参数规模,在国际知名榜单 AA-Index(Artificial Analysis Intelligence Index)上超越了所有 2B 参数以下模型;相比 3 个月前发布的 Qwen3.5-2B,MiniCPM5-1B 不仅效果更优,参数量还减少了一半。

该模型 INT4 量化后权重仅 0.5GB,能跑在手机上、跑在浏览器里。它的 Base Model 版本由面壁智能自主研发的 AI 训练框架 ForgeTrain 预训练完成

MiniCPM5-1B 现已全面开源,包括模型权重、训练数据集与部署方案。IT之家附相关链接如下:

  • HuggingFace:https://huggingface.openbmb.com/model/openbmb/MiniCPM5-1B
  • GitHub:https://github.com/OpenBMB/MiniCPM
  • ModelScope:https://modelscope.cn/models/OpenBMB/MiniCPM5-1B
  • GitCode:https://ai.gitcode.com/OpenBMB/MiniCPM5-1B
  • 魔乐社区:https://modelers.cn/models/OpenBMB/MiniCPM5-1B

版权声明:本站文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!

评论加载中...