人人都能是配音导演，阶跃星辰发布语音生成模型 StepAudio 2.5 TTS

阶跃星辰发布新一代语音生成模型 StepAudio 2.5 TTS，强调将语境理解能力引入语音生成全流程。通过 Global Context（全局语境）与 Inline Context（文中语境）双重控制，配合 zero-shot 音色复刻，实现对整段情绪基调、角色状态、场景氛围以及句内语气、节奏、停顿等精细化控制，目标是让 AI “演”文本而非单纯朗读。文中并提供官方演示链接。

4 月 16 日消息，阶跃星辰今日发布新一代语音生成模型 StepAudio 2.5 TTS，官方号称人人都能是配音导演。

阶跃星辰官方表示，该语音合成模型首次将语境理解能力引入语音生成全流程。通过 Global Context（全局语境）+ Inline Context（文中语境）双档控制，搭配 Zero-shot 音色复刻，让 AI 不是念文本，而是演文本。

StepAudio 2.5 TTS 支持以下核心能力：