Руководство по Workflow Qwen-Image-2512 для ComfyUI

Qwen-Image-2512 — это обновление модели Qwen-Image за декабрь 2024 года, выпущенное лабораторией Tongyi компании Alibaba. По сравнению с базовой версией, выпущенной в августе, эта новая версия включает несколько улучшений качества генерации изображений.

Основные улучшения：

Улучшенный реализм человека：Сгенерированные изображения людей выглядят более реалистично и естественно, с уменьшенными очевидными артефактами, созданными ИИ
Более тонкие естественные детали：Более детальное отображение пейзажей, меха животных и других природных элементов
Улучшенный рендеринг текста：Текст на сгенерированных изображениях становится более четким и точным, с лучшей интеграцией между текстом и изображениями

Связанные ресурсы：

Руководство по нативному Workflow Qwen-Image-2512 для ComfyUI

Workflow включает два подграфа：

Text to Image (Qwen-Image 2512)：Стандартный процесс генерации в 50 шагов
Text to Image (Qwen-Image 2512 4steps)：Быстрая генерация в 4 шага с использованием Lightning LoRA

1. Файл Workflow

После обновления ComfyUI вы можете найти файл workflow в шаблонах или перетащить файл workflow ниже в ComfyUI для загрузки.

2. Загрузка моделей

Все файлы моделей можно найти на Hugging Face или ModelScope.

Текстовые кодировщики

qwen_2.5_vl_7b_fp8_scaled.safetensors

Модель LoRA（Опционально — для ускорения в 4 шага）

Если вы хотите более высокую скорость генерации, вы можете использовать Lightning LoRA, чтобы сократить шаги генерации с 50 до 4：

Qwen-Image-Lightning-4steps-V1.0.safetensors

Модели диффузии

Вы можете выбрать одну из следующих двух моделей в зависимости от ваших потребностей：

qwen_image_2512_fp8_e4m3fn.safetensors （Рекомендуется для большинства пользователей）
qwen_image_2512_bf16.safetensors （Если у вас достаточно VRAM и вы хотите лучшее качество изображения, вы можете выбрать эту версию）

Модель VAE

qwen_image_vae.safetensors

3. Расположение хранения файлов моделей

После загрузки, пожалуйста, разместите файлы моделей в соответствии со следующей структурой каталогов：

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 text_encoders/
│   │   └── qwen_2.5_vl_7b_fp8_scaled.safetensors
│   ├── 📂 loras/
│   │   └── Qwen-Image-Lightning-4steps-V1.0.safetensors  （Опционально）
│   ├── 📂 diffusion_models/
│   │   ├── qwen_image_2512_fp8_e4m3fn.safetensors        （или qwen_image_2512_bf16.safetensors）
│   └── 📂 vae/
│       └── qwen_image_vae.safetensors

4. Поддерживаемые соотношения сторон изображения

Qwen-Image-2512 поддерживает несколько соотношений сторон изображения. Вы можете выбрать подходящий размер в зависимости от ваших потребностей：

Соотношение сторон	Разрешение
1:1	1328×1328
16:9	1664×928
9:16	928×1664
4:3	1472×1104
3:4	1104×1472
3:2	1584×1056
2:3	1056×1584

Совет：Если вы хотите более высокую скорость генерации, вы можете использовать версию Lightning LoRA в 4 шага. Хотя генерация происходит быстрее, качество изображения может немного отличаться. Мы рекомендуем выбрать подходящую версию в зависимости от ваших реальных потребностей.

Руководство по нативному Workflow Qwen-Image-2512 для ComfyUI

1. Файл Workflow

2. Загрузка моделей

3. Расположение хранения файлов моделей

4. Поддерживаемые соотношения сторон изображения

Комментарии