Руководство по использованию нативного Workflow Qwen-Image-2512 для ComfyUI
Qwen-Image-2512 — это обновление модели Qwen-Image за декабрь 2024 года, выпущенное лабораторией Tongyi компании Alibaba. По сравнению с базовой версией, выпущенной в августе, эта новая версия включает несколько улучшений качества генерации изображений.
Основные улучшения:
- Улучшенный реализм человека:Сгенерированные изображения людей выглядят более реалистично и естественно, с уменьшенными очевидными артефактами, созданными ИИ
- Более тонкие естественные детали:Более детальное отображение пейзажей, меха животных и других природных элементов
- Улучшенный рендеринг текста:Текст на сгенерированных изображениях становится более четким и точным, с лучшей интеграцией между текстом и изображениями
Связанные ресурсы:
Руководство по нативному Workflow Qwen-Image-2512 для ComfyUI
Workflow включает два подграфа:
- Text to Image (Qwen-Image 2512):Стандартный процесс генерации в 50 шагов
- Text to Image (Qwen-Image 2512 4steps):Быстрая генерация в 4 шага с использованием Lightning LoRA
1. Файл Workflow
После обновления ComfyUI вы можете найти файл workflow в шаблонах или перетащить файл workflow ниже в ComfyUI для загрузки.
2. Загрузка моделей
Все файлы моделей можно найти на Hugging Face или ModelScope.
Текстовые кодировщики
Модель LoRA(Опционально — для ускорения в 4 шага)
Если вы хотите более высокую скорость генерации, вы можете использовать Lightning LoRA, чтобы сократить шаги генерации с 50 до 4:
Модели диффузии
Вы можете выбрать одну из следующих двух моделей в зависимости от ваших потребностей:
- qwen_image_2512_fp8_e4m3fn.safetensors (Рекомендуется для большинства пользователей)
- qwen_image_2512_bf16.safetensors (Если у вас достаточно VRAM и вы хотите лучшее качество изображения, вы можете выбрать эту версию)
Модель VAE
3. Расположение хранения файлов моделей
После загрузки, пожалуйста, разместите файлы моделей в соответствии со следующей структурой каталогов:
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 text_encoders/
│ │ └── qwen_2.5_vl_7b_fp8_scaled.safetensors
│ ├── 📂 loras/
│ │ └── Qwen-Image-Lightning-4steps-V1.0.safetensors (Опционально)
│ ├── 📂 diffusion_models/
│ │ ├── qwen_image_2512_fp8_e4m3fn.safetensors (или qwen_image_2512_bf16.safetensors)
│ └── 📂 vae/
│ └── qwen_image_vae.safetensors4. Поддерживаемые соотношения сторон изображения
Qwen-Image-2512 поддерживает несколько соотношений сторон изображения. Вы можете выбрать подходящий размер в зависимости от ваших потребностей:
| Соотношение сторон | Разрешение |
|---|---|
| 1:1 | 1328×1328 |
| 16:9 | 1664×928 |
| 9:16 | 928×1664 |
| 4:3 | 1472×1104 |
| 3:4 | 1104×1472 |
| 3:2 | 1584×1056 |
| 2:3 | 1056×1584 |
Совет:Если вы хотите более высокую скорость генерации, вы можете использовать версию Lightning LoRA в 4 шага. Хотя генерация происходит быстрее, качество изображения может немного отличаться. Мы рекомендуем выбрать подходящую версию в зависимости от ваших реальных потребностей.