Skip to content
ComfyUI Wiki
Помогите создать лучшую базу знаний ComfyUI Стать спонсором
НовостиQwen-Image получил нативную поддержку в ComfyUI

Qwen-Image получил нативную поддержку в ComfyUI

Пример Qwen-Image

Qwen-Image — это модель генерации изображений класса MMDiT с 20 млрд параметров, нацеленная на сложный рендеринг текста и аккуратное редактирование. Проект открыт по лицензии Apache‑2.0. Недавно модель получила нативную интеграцию в ComfyUI, и её можно протестировать напрямую через шаблоны.

Связанные ссылки

Ключевые особенности модели

Согласно странице проекта, модель выделяется в сценариях, связанных с текстом и согласованностью редактирования, а также обладает широкими возможностями генерации и понимания.

  • Сложный рендеринг текста: сохранение типографических деталей и единообразия верстки для разных языков (включая китайский и английский); подходит для изображений с заголовками, слоганами, структурированной версткой
  • Точное редактирование: перенос стиля, добавление/удаление объектов, усиление деталей, редактирование текста в изображении, изменение поз человека
  • Универсальная генерация: плавная адаптация к различным художественным стилям — от фотореализма до минимализма и аниме
  • Задачи понимания изображений: детекция объектов, семантическая сегментация, оценка глубины и границ (Canny), синтез новых ракурсов, супер‑разрешение
  • Экосистема и расширяемость: сообщается о поддержке различных LoRA (например, MajicBeauty) и примерах локального развёртывания с мульти‑GPU и управлением очередями

Доступные версии в ComfyUI

  • Qwen-Image_bf16 (≈ 40.9 GB)
  • Qwen-Image_fp8 (≈ 20.4 GB)
  • Неофициальные «дистиллированные» версии (меньше шагов инференса)

Ресурсы моделей доступны здесь: Hugging Face - Comfy-Org/Qwen-Image_ComfyUIModelScope - Comfy-Org/Qwen-Image_ComfyUI

Производительность

Ниже — результаты измерений ComfyUI Wiki при подготовке официальной документации (RTX 4090D 24 GB).

Qwen-Image_fp8

  • VRAM: 86%
  • Время генерации: 94 с (первый запуск), 71 с (второй)

Qwen-Image_bf16

  • VRAM: 96%
  • Время генерации: 295 с (первый запуск), 131 с (второй)

Источники и дополнительные материалы