网站首页 文章专栏 李飞飞的 World Labs 推出其首款商用世界模型 Marble,支持 3D 环境生成与 AI 原生编辑
李飞飞的 World Labs 推出其首款商用世界模型 Marble,支持 3D 环境生成与 AI 原生编辑
发布 作者:远洋 浏览量:0
World Labs推出首款商业化的3D环境生成产品Marble,支持用户通过多种输入方式生成可编辑的3D环境,并集成AI编辑工具,旨在提升创意控制和应用于游戏开发、影视视效等领域。

11 月 12 日消息,由人工智能先驱李飞飞(Fei-Fei Li)联合创立的初创公司 World Labs 今日正式推出其首款商业化“世界模型”(world model)产品 ——Marble。该产品现已开放免费增值(freemium)与付费订阅服务,支持用户通过文本提示词、照片、视频、3D 布局图或全景图生成可编辑、可下载的 3D 环境

此次发布距 World Labs 结束“隐身模式”并完成 2.3 亿美元(IT之家注:现汇率约合 16.37 亿元人民币)融资仅一年有余,也使其在世界模型赛道上领先于其他竞品。所谓“世界模型”,是指一类能构建环境内部表征的 AI 系统,可用于预测未来状态并规划行动路径。目前,竞争对手如 Decart 与 Odyssey 仅推出免费演示版本;谷歌的 Genie 仍处于有限研究预览阶段。

Marble 的差异化优势在于其生成的是持久化、可下载的 3D 环境,而非像 World Labs 此前发布的实时模型 RTFM(Real-Time Foundation Model)或其他竞品那样,在用户探索过程中动态生成世界。公司表示,这一设计显著减少了场景变形与不一致性,并支持将生成世界导出为高斯泼溅(Gaussian splats)、网格(meshes)或视频格式。

此外,Marble 是业内首款原生集成 AI 编辑工具的模型,并配备混合式 3D 编辑器:用户可先手动构建空间结构框架(如墙体、体块或平面),再由 AI 填充视觉细节。World Labs 联合创始人 Justin Johnson 表示:“这是一种全新类别的模型 —— 生成 3D 世界,其能力将随时间持续提升。事实上,我们已实现了显著改进。”

早在 2023 年 12 月,World Labs 曾展示其早期模型仅凭单张图像生成交互式 3D 场景的能力。尽管效果令人印象深刻,但彼时生成的场景风格偏卡通化,且因移动范围受限与偶发渲染错误,尚无法实现完全自由探索。

此前的 Beta 版仅凭图像提示即可生成高质量世界 —— 从类游戏场景到其客厅的逼真复刻皆表现不俗;虽早期版本存在边缘形变问题,但据称已在正式版中大幅优化。不过,TechCrunch 记者使用同一提示词在 Beta 版生成的世界,在视觉契合度与意图还原度上反而略优于当前正式版结果。

Johnson 强调,编辑功能将使 Marble 迅速应用于游戏开发、影视视效(VFX)与虚拟现实(VR)等近中期落地场景。

“创意主导权”是 Marble 未来发展的核心主题。Johnson 指出:“生成应始终快捷高效,但用户也应能深入干预,对生成内容施加高度控制 —— 我们不希望机器全盘接管,剥夺人类的创造力。”

为实现这一目标,Marble 首先提升了输入灵活性:Beta 版仅支持单张图像输入,迫使模型自行“脑补”360 度视角中未见部分;而正式版现已支持上传多角度图像或短视频片段,从而生成高度逼真的数字孪生环境。

其次,World Labs 推出了实验性 3D 编辑器 Chisel:用户可先粗略勾勒空间布局(如墙体、立方体、平面),再辅以文本提示词引导视觉风格。Marble 由此实现“结构”与“风格”的解耦 —— 类似于 HTML 定义网页结构、CSS 负责视觉呈现。与纯文本编辑不同,Chisel 支持对 3D 对象的直接操控。“我可以直接抓取代表沙发的 3D 体块,将其拖拽至任意位置。”Johnson 解释道。

另一项增强创意控制的新功能是世界扩展(World Expansion)。“生成世界后,您可对其扩展一次,”Johnson 说明,“当您移动至场景边缘、发现结构开始崩解时,可指令模型在当前位置周边继续扩展生成,并增加该区域的细节密度。”

对于需要构建超大空间的用户,“合成器模式”(Composer Mode)支持将多个独立世界无缝拼接。Johnson 曾向记者演示:他将两个已构建世界 ——“奶酪房间配葡萄椅”与“太空中的未来主义会议室”成功组合为一。

定价方面,Marble 提供四档订阅方案:

  • 免费版:支持 4 次生成(文本 / 图像 / 全景图输入);
  • 标准版(20 美元 / 月):12 次生成,支持多图 / 视频输入及高级编辑;
  • 专业版(35 美元 / 月):25 次生成,含场景扩展功能与商业使用权;
  • 旗舰版(95 美元 / 月):75 次生成,解锁全部功能。

Johnson 认为,Marble 的首批应用场景将集中于游戏开发、影视视效与虚拟现实。

然而,游戏行业对生成式 AI 态度审慎。据近期游戏开发者大会(GDC)调查,33% 的受访者认为生成式 AI 对行业产生负面影响 —— 较上年上升 12 个百分点。知识产权侵权、高能耗及 AI 生成内容质量下滑为三大核心关切。去年《Wired》调查更揭露,动视暴雪(Activision Blizzard)等厂商正利用 AI 压缩成本、应对人才流失。

对此,Johnson 强调:Marble 并非旨在取代现有游戏开发全流程,而是作为资产生成工具嵌入既有管线。“它生成背景环境与氛围空间,开发者可将其导入 Unity 或 Unreal Engine 等引擎,再添加交互逻辑与代码。”

在影视视效领域,Johnson 指出,Marble 规避了当前 AI 视频生成器普遍存在的镜头控制不佳与帧间不一致问题,其输出的 3D 资产使艺术家能以逐帧精度布景与运镜。

尽管 World Labs 暂未将 VR 作为当前重点,Johnson 承认该行业“极度渴求内容”,并对 Marble 发布反响热烈。目前,Marble 已全面兼容 Apple Vision Pro 与 Meta Quest 3 头显,所有生成世界均可即刻进入 VR 体验

值得注意的是,Marble 在机器人领域亦具潜力。Johnson 指出,相较于图像与视频生成,机器人领域缺乏大规模训练数据;而 Marble 这类生成器可高效构建仿真训练环境,大幅降低数据获取门槛。

World Labs 首席执行官兼联合创始人李飞飞在近期发布的《世界模型宣言》中指出:Marble 标志着构建“真正具备空间智能的世界模型”的第一步。她坚信:“下一代世界模型将使机器在空间智能层面实现质的飞跃。”若大语言模型教会机器“读写”,她期望 Marble 这样的系统能教会机器“观察”与“构建”。她强调,理解物体在三维空间中的存在方式与交互规律,将推动机器智能突破游戏与机器人领域,延伸至科学探索与医疗创新等更广阔疆域。

“若无空间智能,我们对真正智能机器的憧憬便永无圆满之日。”李飞飞在宣言结尾如此写道。

loading