跻身全球前三:微软最强生图 AI 模型 MAI-Image-2 登场,搞定复杂信息图表

报道介绍微软在 X 平台由 AI 负责人 Mustafa Suleyman 宣布推出第二代图像生成模型 MAI-Image-2。该模型在权威榜单 LMArena 中排名第三,仅次于谷歌与 OpenAI。文章强调 MAI-Image-2 在自然光影、真实肤色和物理环境还原方面表现出色,显著增强了文本渲染能力,能处理信息图表与复杂逻辑图表,并能生成电影级超清图像。文章回顾了初代模型 MAI-Image-1 的表现及此次升级带来的提升;同时提到用户可在 MAI Playground 体验,微软也将其逐步整合到 Copilot 与必应图像创建者中。

3 月 20 日消息,微软 AI 首席执行官穆斯塔法 · 苏莱曼(Mustafa Suleyman)昨日(3 月 19 日)在 X 平台发布推文,宣布推出第二代图像生成模型 MAI-Image-2,在权威的 LMArena 图像生成模型排行榜中跻身第三名。

IT之家注:LMArena(原名为 LMSYS Chatbot Arena)在 AI 图像生成领域具有极高的公信力,被公认为反映模型“真实表现”的全球风向标,目前已成为各大 AI 厂商展示技术实力的“最高竞技场”。

根据最新排行情况,MAI-Image-2 目前位列第三,仅次于谷歌的 gemini-3.1-flash-image-preview 以及 OpenAI 的 gpt-image-1.5-high-fidelity。

在模型表现方面,MAI-Image-2 能够精准还原自然光影效果与真实肤色,并构建出极其逼真的物理环境。

此外,微软研发团队显著增强了模型的文本渲染能力,让新模型在处理包含文字的信息图表、演示幻灯片以及复杂逻辑图表时游刃有余,有效解决了以往 AI 生成图像中文字模糊或乱码的行业痛点。

在应对高难度创作需求时,MAI-Image-2 同样表现优异。它能够轻松生成包含超现实概念、华丽构图以及宏大世界观的电影级超清图像。

回顾发展历程,微软在 2025 年 10 月推出初代模型 MAI-Image-1 时,其在 LMArena 的初始排名仅为第九位。

虽然初代模型主打生成速度快且能避免内容重复,但在综合质量上曾明显落后于其他顶级 AI 实验室,而此次的第二代模型则凭借硬核实力完全扭转了这一局面。

急于尝鲜的用户现在就可以直接登录 MAI Playground 平台进行免费体验。同时,微软正在将 MAI-Image-2 逐步底层整合至 Copilot 和必应图像创建者(Bing Image Creator)中,待推送完成后,海量普通用户即可在日常操作中调用该功能。

版权声明:本站文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!

评论加载中...