面壁智能联合多家机构研发的AgentCPM-Explore智能体模型,仅4B参数,在多个评测基准上表现出色,超越部分8B级和30B级以上模型,并宣布开源。
1 月 14 日消息,面壁智能今日宣布,清华大学自然语言处理实验室、中国人民大学、面壁智能与 OpenBMB 开源社区联合研发 AgentCPM-Explore 智能体模型,基于仅 4B 参数的模型,有望让大模型的长程任务处理能力部署于端侧。
AgentCPM-Explore 在 GAIA、HLE、Browsercomp、Browsercomp (ZH)、WebWalker、FRAMES、Xbench-DeepResesarch、Seal-0 智能体评测基准上均展现出参数效能比,不仅取得同尺寸模型 SOTA,而且越级赶上甚至超越两倍参数量(8B 级)SOTA 模型、比肩部分 30B 级以上和闭源大模型的效果。

在 Xbench-DeepResearch 中,AgentCPM-Explore 的表现超越了 OpenAI-o3、Claude-4.5-Sonnet 等闭源大模型,超越了不同量级 SOTA 模型的表现趋势线,展现出了更高的能力密度。

AgentCPM-Explore 模型宣布开源,并开源了从 Base 模型(GAIA 25.24%)进化至 SOTA 模型(GAIA 63.90%)的全流程代码。
IT之家附开源地址如下: