Qwen-Image получил нативную поддержку в ComfyUI
Qwen-Image — это модель генерации изображений класса MMDiT с 20 млрд параметров, нацеленная на сложный рендеринг текста и аккуратное редактирование. Проект открыт по лицензии Apache‑2.0. Недавно модель получила нативную интеграцию в ComfyUI, и её можно протестировать напрямую через шаблоны.
Связанные ссылки
Ключевые особенности модели
Согласно странице проекта, модель выделяется в сценариях, связанных с текстом и согласованностью редактирования, а также обладает широкими возможностями генерации и понимания.
- Сложный рендеринг текста: сохранение типографических деталей и единообразия верстки для разных языков (включая китайский и английский); подходит для изображений с заголовками, слоганами, структурированной версткой
- Точное редактирование: перенос стиля, добавление/удаление объектов, усиление деталей, редактирование текста в изображении, изменение поз человека
- Универсальная генерация: плавная адаптация к различным художественным стилям — от фотореализма до минимализма и аниме
- Задачи понимания изображений: детекция объектов, семантическая сегментация, оценка глубины и границ (Canny), синтез новых ракурсов, супер‑разрешение
- Экосистема и расширяемость: сообщается о поддержке различных LoRA (например, MajicBeauty) и примерах локального развёртывания с мульти‑GPU и управлением очередями
Доступные версии в ComfyUI
- Qwen-Image_bf16 (≈ 40.9 GB)
- Qwen-Image_fp8 (≈ 20.4 GB)
- Неофициальные «дистиллированные» версии (меньше шагов инференса)
Ресурсы моделей доступны здесь: Hugging Face - Comfy-Org/Qwen-Image_ComfyUI | ModelScope - Comfy-Org/Qwen-Image_ComfyUI
Производительность
Ниже — результаты измерений ComfyUI Wiki при подготовке официальной документации (RTX 4090D 24 GB).
Qwen-Image_fp8
- VRAM: 86%
- Время генерации: 94 с (первый запуск), 71 с (второй)
Qwen-Image_bf16
- VRAM: 96%
- Время генерации: 295 с (первый запуск), 131 с (второй)
Источники и дополнительные материалы
- Страница проекта (функции, новости, деплой): Qwen-Image GitHub
- Технический отчёт (arXiv): Qwen-Image Technical Report
- Ресурсы моделей (комьюнити‑зеркала): Comfy-Org/Qwen-Image_ComfyUI | ModelScope - Comfy-Org/Qwen-Image_ComfyUI
- Дополнительно (гайд): Документация ComfyUI · Нативный рабочий процесс Qwen-Image