ComfyUI 推出子图(Subgraph)功能现已正式推出
2025/08/07
Qwen-Image ComfyUI 原生、GGUF、Nunchaku 工作流完整使用指南
Qwen-Image 是由阿里巴巴通义千问团队开发的图像生成基础模型,采用 20B 参数的 MMDiT(多模态扩散变换器)架构,以 Apache 2.0 许可证形式开源发布。该模型在图像生成领域展现出独特的技术优势,特别是在文本渲染和图像编辑方面表现突出。
核心特性:
- 多语言文本渲染能力:模型能够准确生成包含英语、中文、韩语、日语等多种语言的图像,文本清晰可读且与图像风格协调
- 丰富的艺术风格支持:从写实风格到艺术创作,从动漫风格到现代设计,模型能够根据提示词灵活切换不同的视觉风格
- 精确的图像编辑功能:支持对现有图像进行局部修改、风格转换、内容添加等操作,保持整体视觉一致性
相关资源:
Qwen-Image ComfyUI 原生工作流指南
在本篇文档所附工作流中使用的不同模型有三种
- Qwen-Image 原版模型 fp8_e4m3fn
- 8步加速版: Qwen-Image 原版模型 fp8_e4m3fn 使用 lightx2v 8步 LoRA,
- 蒸馏版:Qwen-Image 蒸馏版模型 fp8_e4m3fn
显存使用参考 GPU: RTX4090D 24GB
使用模型 | VRAM Usage | 首次生成 | 第二次生成 |
---|---|---|---|
fp8_e4m3fn | 86% | ≈ 94s | ≈ 71s |
fp8_e4m3fn 使用 lightx2v 8步 LoRA | 86% | ≈ 55s | ≈ 34s |
蒸馏版 fp8_e4m3fn | 86% | ≈ 69s | ≈ 36s |
1. 工作流文件
更新 ComfyUI 后你可以从模板中找到工作流文件,或者将下面的工作流拖入 ComfyUI 中加载
蒸馏版
2. 模型下载
你可以在 ComfyOrg 仓库找到的版本
- Qwen-Image_bf16 (40.9 GB)
- Qwen-Image_fp8 (20.4 GB)
- 蒸馏版本 (非官方,仅需 15 步)
所有模型均可在 Huggingface 或者 魔搭 找到
Diffusion model
Qwen_image_distill
- 蒸馏版本原始作者建议在 15 步 cfg 1.0
- 经测试该蒸馏版本在 10 步 cfg 1.0 下表现良好,根据你想要的图像类型选择 euler 或 res_multistep
LoRA
Text encoder
VAE
模型保存位置
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 diffusion_models/
│ │ ├── qwen_image_fp8_e4m3fn.safetensors
│ │ └── qwen_image_distill_full_fp8_e4m3fn.safetensors ## 蒸馏版
│ ├── 📂 loras/
│ │ └── Qwen-Image-Lightning-8steps-V1.0.safetensors ## 8步加速 LoRA 模型
│ ├── 📂 vae/
│ │ └── qwen_image_vae.safetensors
│ └── 📂 text_encoders/
│ └── qwen_2.5_vl_7b_fp8_scaled.safetensors
3. 按步骤完成工作流
- 确保
Load Diffusion Model
节点加载了qwen_image_fp8_e4m3fn.safetensors
- 确保
Load CLIP
节点中加载了qwen_2.5_vl_7b_fp8_scaled.safetensors
- 确保
Load VAE
节点中加载了qwen_image_vae.safetensors
- 确保
EmptySD3LatentImage
节点中设置好了图片的尺寸 - 在
CLIP Text Encoder
节点中设置好提示词,目前经过测试目前至少支持:英语、中文、韩语、日语、意大利语等 - 如果需要启用 lightx2v 的 8 步加速 LoRA ,请选中后用
Ctrl + B
启用该节点,并按 序号8
处的设置参数修改 Ksampler 的设置设置 - 点击
Queue
按钮,或者使用快捷键Ctrl(cmd) + Enter(回车)
来运行工作流 - 对于不同版本的模型和工作流的对应 KSampler 的参数设置
蒸馏版模型和 lightx2v 的 8 步加速 LoRA 似乎不能同时使用,你可以测试具体的组合参数来验证组合使用的方式是否可行
Qwen-Image GGUF 版 ComfyUI 工作流
GGUF 版本对低显存用户来说比较友好,在某些权重情况下你只需要 8GB 左右的显存即可运行 Qwen-Image
显存使用情况参考:
Workflow | VRAM Usage | 首次生成 | 后续生成 |
---|---|---|---|
qwen-image-Q4_K_S.gguf | 56% | ≈ 135s | ≈ 77s |
With 8steps LoRA | 56% | ≈ 100s | ≈ 45s |
模型地址:Qwen-Image-gguf
1. 更新或者安装自定义节点
使用 GGUF 版本需要你安装或者 更新 ComfyUI-GGUF 这个插件
具体请参考如何安装 ComfyUI 自定义节点,或者通过 Manager 搜索安装即可
2. 工作流下载
3. 模型下载
GGUF 版本使用的模型仅有 diffusion 模型与其它的不同
请访问 https://huggingface.co/city96/Qwen-Image-gguf 下载任意一个权重,通常文件体积越大质量越好,同时也要求更高的显存,在本篇教程中我将使用下面的版本
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 diffusion_models/
│ │ └── qwen-image-Q4_K_S.gguf # 或者其它你选择的版本
3. 按步骤完成工作流
- 确保
Unet Loader(GGUF)
节点中加载了qwen-image-Q4_K_S.gguf
或者其它你下载的版本- 请确保 ComfyUI-GGUF 已经安装并更新
- 对于
LightX2V 8Steps LoRA
默认并未启用,你可以选中后使用 Ctrl+B 启用该节点 - 如果未启用 8 步 LoRA 时,对应的步数默认为 20 , 如果你启用了 8 步 LoRA 请把它设置为 8
- 这里是对应设置步数的参考
- 点击
Queue
按钮,或者使用快捷键Ctrl(cmd) + Enter(回车)
来运行工作流
Qwen-Image Nunchaku 版工作流
模型地址:nunchaku-qwen-image 自定义节点地址:https://github.com/nunchaku-tech/ComfyUI-nunchaku
待支持 Nunchaku 支持