阿里云通义开源 6B 参数 Z-Image 基座模型,生成图片拒绝 AI “大众脸”
1 天前 / 阅读约2分钟
来源:IT之家
阿里云通义1月28日开源发布Z-Image基座模型,尺寸为6B,支持CFG引导机制,为LoRA等微调任务提供训练底座,优化生成同质化痛点,可灵敏响应负向提示词。
感谢IT之家网友 IENONE、Domado、Kazuto、斯文当不了饭吃、三元不二 的线索投递!

IT之家 1 月 28 日消息,阿里云通义今日(1 月 28 日)正式开源发布 Z-Image 基座模型

该模型尺寸为 6B,为非蒸馏基座模型,保留全量权重分布,原生支持 CFG 引导机制,为 LoRA、ControlNet 等微调任务提供训练底座。

Z-Image 宣称打破单一维度的写实局限:无论是追求光影的 Photorealism,还是具有情绪张力的动漫与数字艺术,Z-Image 均能捕捉并重构每一处风格细节。

Z-Image 采用非蒸馏基座架构,保留全量权重分布,原生支持 CFG 引导机制,为 LoRA、ControlNet 等微调任务提供训练底座。

此外,Z-Image 专项优化了生成“同质化”痛点:优化采样空间分布,确保不同原生出图的面孔与构图具备显著差异;多人场景剥离个体特征,拒绝 AI “大众脸”

Z-Image 还可灵敏响应负向提示词,通过 Negative Prompt 快速过滤瑕疵、净化画面,实现从构图到光影的深度掌控。

IT之家附 Z-Image 开源地址如下:

  • GitHub:https://github.com/Tongyi-MAI/Z-Image

  • 魔搭:https://modelscope.cn/models/Tongyi-MAI/Z-Image

  • Hugging Face:https://huggingface.co/Tongyi-MAI/Z-Image