SVI 2.0 Pro 发布 - 支持 Wan 2.2 的无限长度视频生成
2025/12/29
Qwen-Image-2512 ComfyUI 原生工作流使用指南
Qwen-Image-2512 是阿里巴巴通义千问团队在 2024 年 12 月发布的 Qwen-Image 模型更新版本。相比 8 月发布的基础版本,新版本在图像生成质量方面进行了多项改进。
主要改进内容:
- 人物真实感提升:生成的人物图像看起来更真实自然,减少了明显的 AI 生成痕迹
- 自然细节更丰富:在风景、动物毛发等自然元素的细节表现更加细腻
- 文字渲染优化:生成图像中的文字更加清晰准确,文字与图像的组合也更加协调
相关资源:
Loading...
Qwen-Image-2512 ComfyUI 原生工作流指南
工作流中包含两个子图:
- Text to Image (Qwen-Image 2512):标准的 50 步生成流程
- Text to Image (Qwen-Image 2512 4steps):使用 Lightning LoRA 实现的 4 步快速生成
1. 工作流文件
更新 ComfyUI 后,你可以从模板中找到工作流文件,或者将下面的工作流文件拖入 ComfyUI 中加载。
2. 模型下载
所有模型文件均可在 Hugging Face 或 ModelScope 找到。
文本编码器 (Text Encoders)
LoRA 模型(可选 - 用于 4 步加速)
如果你想要更快的生成速度,可以使用 Lightning LoRA 将生成步数从 50 步减少到 4 步:
扩散模型 (Diffusion Models)
你可以根据需要选择以下两种模型之一:
- qwen_image_2512_fp8_e4m3fn.safetensors (推荐,适合大多数用户使用)
- qwen_image_2512_bf16.safetensors (如果你有足够的显存且想要更好的图像质量,可以选择此版本)
VAE 模型
3. 模型文件存放位置
下载完成后,请将模型文件按照以下目录结构放置:
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 text_encoders/
│ │ └── qwen_2.5_vl_7b_fp8_scaled.safetensors
│ ├── 📂 loras/
│ │ └── Qwen-Image-Lightning-4steps-V1.0.safetensors (可选)
│ ├── 📂 diffusion_models/
│ │ ├── qwen_image_2512_fp8_e4m3fn.safetensors (或 qwen_image_2512_bf16.safetensors)
│ └── 📂 vae/
│ └── qwen_image_vae.safetensors4. 支持的图像尺寸比例
Qwen-Image-2512 支持多种图像宽高比,你可以根据需求选择合适的尺寸:
| 宽高比 | 分辨率 |
|---|---|
| 1:1 | 1328×1328 |
| 16:9 | 1664×928 |
| 9:16 | 928×1664 |
| 4:3 | 1472×1104 |
| 3:4 | 1104×1472 |
| 3:2 | 1584×1056 |
| 2:3 | 1056×1584 |
提示:如果你想要更快的生成速度,可以使用 4 步 Lightning LoRA 版本。虽然生成速度更快,但图像质量可能会略有差异,建议根据你的实际需求选择合适的版本。