网站首页 文章专栏 谷歌 Nano Banana 2 首批 AI 样本流出:不仅会画画,还懂物理
谷歌新一代 AI 图像模型 Nano Banana 2 的早期预览样本意外泄露,展示了其强大的图像生成与编辑能力,特别是在图像修复和复杂色彩编辑方面的技术实力。
11 月 11 日消息,科技媒体 testingcatalog 昨日(11 月 10 日)发布博文,报道称谷歌新一代 AI 图像模型 Nano Banana 2 的早期预览样本意外泄露,展示了其强大的图像生成与编辑能力。
Nano Banana 2 的预览版本在 Media.ai 平台短暂上线后被迅速撤下,但其生成的图像样本已在社交媒体上广泛传播,其在提升低质量图片清晰度(图像修复)和执行复杂的色彩编辑指令方面,展现出强大的技术实力。
根据泄露的资料,Nano Banana 2 主要带来 2 项改进,其一是能够解决与物理逻辑相关的视觉任务。例如,在一张泄露的图片中,模型通过“图生图”(img2img)技术,准确绘制出了小球运动的物理轨迹,这是当前其他模型难以完成的复杂任务。

其二,该模型在文本渲染方面表现极为出色,能够根据自然语言提示,在白板等介质上绘制出字体一致且排列精确的复杂文字,有效解决了以往模型在图像内生成清晰文本的难题。


该媒体还指出,Nano Banana 2 在视觉保真度和指令遵循能力上的飞跃,表明其模型内部集成了更深层次的世界知识。这一进步使其不再局限于简单的图像生成,而是能够理解并执行更复杂的、包含逻辑关系的指令。IT之家附上相关图片如下:






这些高级能力为设计、媒体内容制作和自动化工作流等领域开辟了新的可能性。例如,企业未来或许可以通过 API 接口,程序化地调用该模型,快速生成符合要求的营销海报或社交媒体视觉素材,从而大幅提升内容生产效率。
