Выпущен Qwen-Image-Layered - Модель генерации изображений с поддержкой редактирования по слоям
19.12.2025
Выпущен Qwen-Image-Layered - Модель генерации изображений с поддержкой редактирования по слоям

Qwen-Image-Layered — это генеративная модель, способная разлагать изображения на несколько RGBA слоев. Благодаря такому слоевому представлению каждый слой можно редактировать независимо, не затрагивая остальное содержимое изображения. Такой подход физической изоляции обеспечивает более точное и согласованное редактирование изображений.
Основные функции
Возможность разложения по слоям
Qwen-Image-Layered может разлагать одно изображение на несколько независимых RGBA слоев. Каждый слой содержит определенные семантические или структурные компоненты изображения, такие как объекты переднего плана, элементы фона, текст и т.д. Такое разложение обеспечивает основу для последующих операций редактирования.
Независимое редактирование слоев
Разложенные слои можно редактировать независимо различными способами:
- Перекрашивание: Изменение цвета определенного слоя при сохранении всего остального контента без изменений
- Замена контента: Замена содержимого слоя другим содержимым, например, изменение человека с девочки на мальчика
- Изменение текста: Модификация текстового содержимого в изображениях
- Удаление объектов: Чистое удаление нежелательных объектов
- Изменение размера: Изменение размера объектов без искажений
- Перемещение: Свободное перемещение объектов в пределах холста
Все эти операции затрагивают только целевой слой и не влияют на другие слои, обеспечивая согласованность и точность редактирования.
Гибкое количество слоев
Модель не ограничивает количество слоев фиксированным числом. Изображения можно разлагать на разное количество слоев по мере необходимости. Например, изображение можно разложить на 3 слоя или 8 слоев в зависимости от конкретных требований.
Рекурсивное разложение
Модель также поддерживает рекурсивное разложение, при котором любой слой может быть дополнительно разложен на большее количество подуровней. Эта функция позволяет процессу разложения продолжаться бесконечно, обеспечивая большую гибкость для сложных задач редактирования.
Технические особенности
Qwen-Image-Layered разработан на основе модели Qwen-Image и использует лицензию с открытым исходным кодом Apache 2.0. Модель использует формат RGBA для представления слоев, что означает, что каждый слой содержит полную информацию о цвете и прозрачности, делая композицию между слоями более естественной.
Нативная поддержка ComfyUI
Qwen-Image-Layered получил нативную поддержку в ComfyUI, позволяя пользователям напрямую использовать модель для редактирования изображений на основе слоев в ComfyUI. Связанные файлы рабочих процессов можно получить из GitHub.
Практические применения
Такой подход к редактированию на основе слоев особенно подходит для сценариев, требующих точного контроля над различными частями изображения, таких как:
- Дизайн продуктов: Независимая настройка цветов продуктов без влияния на фон
- Создание рекламы: Легкая замена или изменение текста и элементов в рекламе
- Композиция изображений: Точное объединение нескольких элементов, каждый из которых можно настраивать независимо
- Создание контента: Гибкая настройка различных компонентов в изображениях
Для нетехнических пользователей такой подход к редактированию на основе слоев также легче понять и использовать, поскольку каждая операция затрагивает только определенные слои, делая результаты более предсказуемыми.
Связанные ссылки
- Страница модели на Hugging Face
- Страница модели на ModelScope
- Исследовательская статья
- Блог проекта
- Онлайн-демо
- Рабочий процесс ComfyUI