Skip to content
Follow me on X
ComfyUI Wiki
新闻阿里巴巴通义实验室发布 Z-Image-Base - 非蒸馏版高质量图像生成模型

阿里巴巴通义实验室发布 Z-Image-Base - 非蒸馏版高质量图像生成模型

2026年1月28日,阿里巴巴通义实验室正式发布了 Z-Image-Base 模型,这是 Z-Image 系列的非蒸馏原始检查点版本。ComfyUI 在发布当天即提供了完整支持,实现了 Day-0 集成。

模型定位

Z-Image-Base 是 Z-Image 模型家族的核心基础,与追求速度的蒸馏版本 Z-Image-Turbo 不同,Base 版本保留了架构的完整生成潜力。虽然需要 30-50 步采样(CFG 3-5)才能达到最佳质量,生成时间较长,但能够产出更丰富的视觉细节和更高的艺术上限。

主要特性

多样化美学表现

Z-Image-Base 支持更广泛的艺术风格范围,同时保持卓越的照片级真实感质量。相比蒸馏版本,基础模型在艺术表现力和风格多样性方面具有明显优势。

微调友好

作为非蒸馏的完整模型,Z-Image-Base 是社区微调和专业化开发的理想基础模型。开发者可以基于此模型训练 LoRA、进行风格迁移或创建定制化的图像生成解决方案。

负面提示词高响应

模型对负面提示词(Negative Prompts)具有高度响应性,能够实现精确的生成控制。用户可以通过负面提示词有效避免不想要的元素或风格。

增强的多样性

相比蒸馏版本,Base 模型具有更高的生成多样性,能够产出更具创意和变化的结果,适合需要探索性创作的场景。

性能表现

在 NVIDIA RTX Pro 6000 Blackwell 显卡上,生成 1024×1024 分辨率图像(30步采样)仅需 13.3秒

在 ComfyUI 中使用

ComfyUI 在 Z-Image-Base 发布当天即提供完整支持。使用步骤:

  1. 更新 ComfyUI:确保运行最新版本的 ComfyUI
  2. 访问工作流模板
    • 点击侧边栏的 Templates
    • 进入 Template library
    • 搜索 “Z-image” 工作流

官方工作流

你可以从以下链接下载官方工作流模板:

模型文件

模型文件需要下载并放置到对应目录:

文本编码器(text_encoders)

  • qwen_3_4b.safetensors

扩散模型(diffusion_models)

  • z_image_base_bf16.safetensors

VAE

  • ae.safetensors

文件存放位置

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 text_encoders/
│   │      └── qwen_3_4b.safetensors
│   ├── 📂 diffusion_models/
│   │      └── z_image_base_bf16.safetensors
│   └── 📂 vae/
│          └── ae.safetensors

推荐参数设置

  • 采样步数:30-50 步
  • CFG Scale:3-5
  • 分辨率:1024×1024(推荐)

应用场景

Z-Image-Base 特别适合以下场景:

  • 专业摄影级人像:精细的皮肤纹理、自然的光影效果
  • 建筑与室内设计:高质量的空间渲染、材质表现
  • 艺术创作:多样化的风格探索、创意实验
  • 商业视觉设计:产品摄影、广告素材制作
  • 模型微调基础:LoRA 训练、风格定制

与 Z-Image-Turbo 的对比

特性Z-Image-BaseZ-Image-Turbo
采样步数30-50 步8 步
生成速度较慢极快
视觉细节更丰富优秀
艺术上限更高
生成多样性更强良好
微调友好度极佳一般
负面提示词响应高度响应响应良好
适用场景专业创作、微调开发快速原型、日常创作

Z-Image 系列生态

目前 Z-Image 系列已形成完整的生态体系:

  • Z-Image-Base:非蒸馏基础模型,最高质量和灵活性
  • Z-Image-Turbo:蒸馏加速版本,8步快速生成
  • Z-Image-Edit:图像编辑专用版本(即将发布)
  • ControlNet Union 2.1:支持多种控制条件(Canny、HED、Depth、Pose、MLSD)
  • TwinFlow 加速版:实验性更快版本(开发中)

相关链接