网站首页 文章专栏 罗福莉加入小米后首秀,解释 MiMo-V2-Flash 模型如何做到推理速度飞快
文章介绍了2025年小米人车家全生态合作伙伴大会上,Xiaomi MiMo大模型负责人罗福莉的首秀,重点讲解了新发布的MiMo-V2-Flash开源MoE模型的特点,包括其极快的推理速度、模型结构设计、以及在代码和Agent评测基准上的优异表现。同时,罗福莉还展望了下一代智能体系统的发展方向。
12 月 17 日消息,2025 小米人车家全生态合作伙伴大会于今日举行,Xiaomi MiMo 大模型负责人罗福莉迎来入职后首秀。

小米昨日晚间惊喜发布了 Xiaomi MiMo-V2-Flash 开源 MoE 模型,总参数量 309B,活跃参数量 15B,专为智能体 AI 设计,专注于快。不少IT之家小伙伴体验后发现,该模型推理速度非常快。
罗福莉解释称,MiMo-V2-Flash 围绕极致推理效率设计了模型结构,通过 3 层 MTP 推理加速并行 Token 验证,实现了 2.0~2.6 倍的推理速度提升。



MiMo-V2-Flash 凭借总参数 309B(激活 15B),实现了代码和 Agent 评测基准上全球开源模型 Top2,且初步具备模拟世界的能力,可通过 HTML 写操作系统、模拟太阳系、画一棵圣诞树等。



罗福莉还谈到了下一代智能体系统,认为下一代智能体系统不是一个“语言模拟器”,而是一个真正能够理解世界、并与之共存的“智能体”。



2025 小米“人车家全生态”合作伙伴大会专题
