Skip to content
Follow me on X
ComfyUI Wiki

Qwen-Image-2512 ComfyUI 原生工作流使用指南

Qwen-Image-2512 是阿里巴巴通义千问团队在 2024 年 12 月发布的 Qwen-Image 模型更新版本。相比 8 月发布的基础版本,新版本在图像生成质量方面进行了多项改进。

主要改进内容

  • 人物真实感提升:生成的人物图像看起来更真实自然,减少了明显的 AI 生成痕迹
  • 自然细节更丰富:在风景、动物毛发等自然元素的细节表现更加细腻
  • 文字渲染优化:生成图像中的文字更加清晰准确,文字与图像的组合也更加协调

相关资源:

Loading...

Qwen-Image-2512 ComfyUI 原生工作流指南

工作流中包含两个子图:

  • Text to Image (Qwen-Image 2512):标准的 50 步生成流程
  • Text to Image (Qwen-Image 2512 4steps):使用 Lightning LoRA 实现的 4 步快速生成

1. 工作流文件

更新 ComfyUI 后,你可以从模板中找到工作流文件,或者将下面的工作流文件拖入 ComfyUI 中加载。

2. 模型下载

所有模型文件均可在 Hugging FaceModelScope 找到。

文本编码器 (Text Encoders)

LoRA 模型(可选 - 用于 4 步加速)

如果你想要更快的生成速度,可以使用 Lightning LoRA 将生成步数从 50 步减少到 4 步:

扩散模型 (Diffusion Models)

你可以根据需要选择以下两种模型之一:

VAE 模型

3. 模型文件存放位置

下载完成后,请将模型文件按照以下目录结构放置:

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 text_encoders/
│   │   └── qwen_2.5_vl_7b_fp8_scaled.safetensors
│   ├── 📂 loras/
│   │   └── Qwen-Image-Lightning-4steps-V1.0.safetensors  (可选)
│   ├── 📂 diffusion_models/
│   │   ├── qwen_image_2512_fp8_e4m3fn.safetensors        (或 qwen_image_2512_bf16.safetensors)
│   └── 📂 vae/
│       └── qwen_image_vae.safetensors

4. 支持的图像尺寸比例

Qwen-Image-2512 支持多种图像宽高比,你可以根据需求选择合适的尺寸:

宽高比分辨率
1:11328×1328
16:91664×928
9:16928×1664
4:31472×1104
3:41104×1472
3:21584×1056
2:31056×1584

提示:如果你想要更快的生成速度,可以使用 4 步 Lightning LoRA 版本。虽然生成速度更快,但图像质量可能会略有差异,建议根据你的实际需求选择合适的版本。