阿里云通义开源了6B参数的Z-Image基座模型,该模型为非蒸馏基座模型,保留全量权重分布,原生支持CFG引导机制,适用于LoRA、ControlNet等微调任务。Z-Image能够生成多样化的图片风格,包括写实、动漫和数字艺术,并优化了生成图片的同质化问题,拒绝AI“大众脸”。此外,模型还能灵敏响应负向提示词,通过Negative Prompt快速过滤瑕疵,净化画面。开源地址已发布在GitHub、魔搭和Hugging Face平台。
1 月 28 日消息,阿里云通义今日(1 月 28 日)正式开源发布 Z-Image 基座模型。
该模型尺寸为 6B,为非蒸馏基座模型,保留全量权重分布,原生支持 CFG 引导机制,为 LoRA、ControlNet 等微调任务提供训练底座。

Z-Image 宣称打破单一维度的写实局限:无论是追求光影的 Photorealism,还是具有情绪张力的动漫与数字艺术,Z-Image 均能捕捉并重构每一处风格细节。

Z-Image 采用非蒸馏基座架构,保留全量权重分布,原生支持 CFG 引导机制,为 LoRA、ControlNet 等微调任务提供训练底座。

此外,Z-Image 专项优化了生成“同质化”痛点:优化采样空间分布,确保不同原生出图的面孔与构图具备显著差异;多人场景剥离个体特征,拒绝 AI “大众脸”。

Z-Image 还可灵敏响应负向提示词,通过 Negative Prompt 快速过滤瑕疵、净化画面,实现从构图到光影的深度掌控。

IT之家附 Z-Image 开源地址如下:
- GitHub:https://github.com/Tongyi-MAI/Z-Image
- 魔搭:https://modelscope.cn/models/Tongyi-MAI/Z-Image
- Hugging Face:https://huggingface.co/Tongyi-MAI/Z-Image