2 月 12 日消息,据《科创板日报》报道,字节跳动火山引擎初步确定 2026 年 2 月 14 日发布豆包大模型的一系列重要升级发布。本次模型发布涉及豆包大模型 2.0、音视频创作模型 Seedance 2.0、图像创作模型 Seedream 5.0 Preview。此次升级,豆包大模型 2.0 将正式发布,基础模型能力和企业级 Agent 能力将有大幅提升。
豆包视频生成模型 Seedance 升级要点:复杂交互和运动生成可用率高,业界最佳级别;多模态能力全面,支持音、视、图全模态输入;可控性强,指令遵循表现好;深度适配影视、广告及营销场景,输出质量对齐工业交付标准。
另外,豆包图像创作模型 Seedream 升级要点包括,首次引入实时检索增强能力,可以获取最新的知识和资讯,精准响应具有时效性的创作需求;世界知识与多语种能力增强,模型内置科技与人文领域丰富的世界知识;理解与生成表现全面提升,可以通过简短、模糊的文本和图像输入理解用户意图,主体一致性和图文对齐的表现也有进步。

IT之家注意到,在去年 12 月举行的 FORCE 原动力大会上,火山引擎发布豆包大模型 1.8、豆包视频生成模型 Seedance 1.5 pro。经过一年多的持续升级,豆包大模型家族在多模态理解和生成能力、Agent 能力上,已位于全球第一梯队。
截至 2025 年 12 月,豆包大模型日均 Tokens 使用量已突破 50 万亿,居中国第一、全球第三。目前,已有超过 100 家企业在火山引擎上累计 Tokens 使用量超过一万亿。
去年发布的豆包大模型 1.8 专门面向多模态 Agent 场景进行了定向优化,工具调用能力、复杂指令遵循能力、OS Agent 能力大幅增强,大幅提升了视觉理解的基础能力,原生支持智能上下文管理。