Skip to content
ComfyUI Wiki
帮助构建更好的 ComfyUI 知识库 成为赞助者

Qwen-Image ComfyUI 原生、GGUF、Nunchaku 工作流完整使用指南

Qwen-Image 是由阿里巴巴通义千问团队开发的图像生成基础模型,采用 20B 参数的 MMDiT(多模态扩散变换器)架构,以 Apache 2.0 许可证形式开源发布。该模型在图像生成领域展现出独特的技术优势,特别是在文本渲染和图像编辑方面表现突出。

核心特性

  • 多语言文本渲染能力:模型能够准确生成包含英语、中文、韩语、日语等多种语言的图像,文本清晰可读且与图像风格协调
  • 丰富的艺术风格支持:从写实风格到艺术创作,从动漫风格到现代设计,模型能够根据提示词灵活切换不同的视觉风格
  • 精确的图像编辑功能:支持对现有图像进行局部修改、风格转换、内容添加等操作,保持整体视觉一致性

相关资源:

Loading...

Qwen-Image ComfyUI 原生工作流指南

在本篇文档所附工作流中使用的不同模型有三种

  1. Qwen-Image 原版模型 fp8_e4m3fn
  2. 8步加速版: Qwen-Image 原版模型 fp8_e4m3fn 使用 lightx2v 8步 LoRA,
  3. 蒸馏版:Qwen-Image 蒸馏版模型 fp8_e4m3fn

显存使用参考 GPU: RTX4090D 24GB

使用模型VRAM Usage首次生成第二次生成
fp8_e4m3fn86%≈ 94s≈ 71s
fp8_e4m3fn 使用 lightx2v 8步 LoRA86%≈ 55s≈ 34s
蒸馏版 fp8_e4m3fn86%≈ 69s≈ 36s

1. 工作流文件

更新 ComfyUI 后你可以从模板中找到工作流文件,或者将下面的工作流拖入 ComfyUI 中加载 Qwen-image 文生图工作流

蒸馏版

2. 模型下载

你可以在 ComfyOrg 仓库找到的版本

  • Qwen-Image_bf16 (40.9 GB)
  • Qwen-Image_fp8 (20.4 GB)
  • 蒸馏版本 (非官方,仅需 15 步)

所有模型均可在 Huggingface 或者 魔搭 找到

Diffusion model

Qwen_image_distill

  • 蒸馏版本原始作者建议在 15 步 cfg 1.0
  • 经测试该蒸馏版本在 10 步 cfg 1.0 下表现良好,根据你想要的图像类型选择 euler 或 res_multistep

LoRA

Text encoder

VAE

模型保存位置

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 diffusion_models/
│   │   ├── qwen_image_fp8_e4m3fn.safetensors
│   │   └── qwen_image_distill_full_fp8_e4m3fn.safetensors ## 蒸馏版
│   ├── 📂 loras/
│   │   └── Qwen-Image-Lightning-8steps-V1.0.safetensors   ## 8步加速 LoRA 模型
│   ├── 📂 vae/
│   │   └── qwen_image_vae.safetensors
│   └── 📂 text_encoders/
│       └── qwen_2.5_vl_7b_fp8_scaled.safetensors

3. 按步骤完成工作流

步骤图

  1. 确保 Load Diffusion Model节点加载了qwen_image_fp8_e4m3fn.safetensors
  2. 确保 Load CLIP节点中加载了qwen_2.5_vl_7b_fp8_scaled.safetensors
  3. 确保 Load VAE节点中加载了qwen_image_vae.safetensors
  4. 确保 EmptySD3LatentImage节点中设置好了图片的尺寸
  5. CLIP Text Encoder节点中设置好提示词,目前经过测试目前至少支持:英语、中文、韩语、日语、意大利语等
  6. 如果需要启用 lightx2v 的 8 步加速 LoRA ,请选中后用 Ctrl + B 启用该节点,并按 序号8 处的设置参数修改 Ksampler 的设置设置
  7. 点击 Queue 按钮,或者使用快捷键 Ctrl(cmd) + Enter(回车) 来运行工作流
  8. 对于不同版本的模型和工作流的对应 KSampler 的参数设置

蒸馏版模型和 lightx2v 的 8 步加速 LoRA 似乎不能同时使用,你可以测试具体的组合参数来验证组合使用的方式是否可行

Qwen-Image GGUF 版 ComfyUI 工作流

GGUF 版本对低显存用户来说比较友好,在某些权重情况下你只需要 8GB 左右的显存即可运行 Qwen-Image

显存使用情况参考:

WorkflowVRAM Usage首次生成后续生成
qwen-image-Q4_K_S.gguf56%≈ 135s≈ 77s
With 8steps LoRA56%≈ 100s≈ 45s

模型地址:Qwen-Image-gguf

1. 更新或者安装自定义节点

使用 GGUF 版本需要你安装或者 更新 ComfyUI-GGUF 这个插件

具体请参考如何安装 ComfyUI 自定义节点,或者通过 Manager 搜索安装即可

2. 工作流下载

Qwen-Image GGUF 工作流

3. 模型下载

GGUF 版本使用的模型仅有 diffusion 模型与其它的不同

请访问 https://huggingface.co/city96/Qwen-Image-gguf 下载任意一个权重,通常文件体积越大质量越好,同时也要求更高的显存,在本篇教程中我将使用下面的版本

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 diffusion_models/
│   │   └── qwen-image-Q4_K_S.gguf # 或者其它你选择的版本

3. 按步骤完成工作流

步骤图

  1. 确保 Unet Loader(GGUF) 节点中加载了 qwen-image-Q4_K_S.gguf 或者其它你下载的版本
    • 请确保 ComfyUI-GGUF 已经安装并更新
  2. 对于 LightX2V 8Steps LoRA 默认并未启用,你可以选中后使用 Ctrl+B 启用该节点
  3. 如果未启用 8 步 LoRA 时,对应的步数默认为 20 , 如果你启用了 8 步 LoRA 请把它设置为 8
  4. 这里是对应设置步数的参考
  5. 点击 Queue 按钮,或者使用快捷键 Ctrl(cmd) + Enter(回车) 来运行工作流

Qwen-Image Nunchaku 版工作流

模型地址:nunchaku-qwen-image 自定义节点地址:https://github.com/nunchaku-tech/ComfyUI-nunchaku

待支持 Nunchaku 支持