谷歌 Nano Banana 2 首批 AI 样本流出：不仅会画画，还懂物理

谷歌新一代 AI 图像模型 Nano Banana 2 的早期预览样本意外泄露，展示了其强大的图像生成与编辑能力，特别是在图像修复和复杂色彩编辑方面的技术实力。

11 月 11 日消息，科技媒体 testingcatalog 昨日（11 月 10 日）发布博文，报道称谷歌新一代 AI 图像模型 Nano Banana 2 的早期预览样本意外泄露，展示了其强大的图像生成与编辑能力。

Nano Banana 2 的预览版本在 Media.ai 平台短暂上线后被迅速撤下，但其生成的图像样本已在社交媒体上广泛传播，其在提升低质量图片清晰度（图像修复）和执行复杂的色彩编辑指令方面，展现出强大的技术实力。

根据泄露的资料，Nano Banana 2 主要带来 2 项改进，其一是能够解决与物理逻辑相关的视觉任务。例如，在一张泄露的图片中，模型通过“图生图”（img2img）技术，准确绘制出了小球运动的物理轨迹，这是当前其他模型难以完成的复杂任务。

其二，该模型在文本渲染方面表现极为出色，能够根据自然语言提示，在白板等介质上绘制出字体一致且排列精确的复杂文字，有效解决了以往模型在图像内生成清晰文本的难题。

该媒体还指出，Nano Banana 2 在视觉保真度和指令遵循能力上的飞跃，表明其模型内部集成了更深层次的世界知识。这一进步使其不再局限于简单的图像生成，而是能够理解并执行更复杂的、包含逻辑关系的指令。IT之家附上相关图片如下：

这些高级能力为设计、媒体内容制作和自动化工作流等领域开辟了新的可能性。例如，企业未来或许可以通过 API 接口，程序化地调用该模型，快速生成符合要求的营销海报或社交媒体视觉素材，从而大幅提升内容生产效率。