Alibaba Tongyi Lab выпустила Z-Image-Turbo — эффективную модель генерации изображений с 6B параметрами

27 ноября 2025 года Alibaba Tongyi Lab официально выпустила Z-Image-Turbo — высокоэффективную модель генерации изображений нового поколения. Имея всего 6B параметров, эта модель достигает производительности, сопоставимой с закрытыми флагманскими моделями с более чем 20B параметрами, особенно преуспевая в генерации высококачественных фотореалистичных портретов.

Основные особенности

Эффективная архитектура параметров

Z-Image-Turbo использует масштабируемую однопоточную архитектуру DiT (S3-DiT), которая объединяет текстовые, визуально-семантические токены и токены VAE изображения на уровне последовательности в единый входной поток, максимизируя эффективность параметров. Такой дизайн позволяет модели поддерживать высокое качество выходных данных при значительном снижении требований к вычислительным ресурсам.

Совместимость с потребительскими GPU

Это одна из самых привлекательных особенностей Z-Image-Turbo:

Использование видеопамяти строго контролируется на уровне менее 16 ГБ
Генерация изображений разрешением 1024×1024 всего за 2,3 секунды на RTX 4090
Генерация изображений 2K всего за 4,8 секунды на NVIDIA RTX Pro 6000 Blackwell
Создание качественных изображений всего за 8 шагов сэмплирования
Может работать даже на RTX 3060 с 6 ГБ видеопамяти

Отличный рендеринг текста

Z-Image-Turbo превосходно справляется с рендерингом текста на китайском и английском языках:

Точный рендеринг сложного китайского и английского текста
Сохранение реалистичности лиц и визуальной эстетики
Результаты, сопоставимые с лучшими закрытыми моделями

Фотореалистичные портреты

Модель особенно хорошо справляется с генерацией:

Высококачественных портретов персонажей
Естественных текстур кожи и световых эффектов
Кинематографического освещения и композиции
Различных стилей портретной фотографии

Использование в ComfyUI

Z-Image-Turbo теперь поддерживается в ComfyUI. Вам необходимо:

Обновить ComfyUI до последней версии
Скачать необходимые файлы модели
Импортировать рабочий процесс (workflow) для начала работы

Файлы модели

Вам нужно скачать следующие файлы модели и разместить их в соответствующих директориях:

Текстовые энкодеры (text_encoders)

qwen_3_4b.safetensors

Диффузионные модели (diffusion_models)

z_image_turbo_bf16.safetensors

VAE

ae.safetensors

Расположение файлов

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 text_encoders/
│   │      └── qwen_3_4b.safetensors
│   ├── 📂 diffusion_models/
│   │      └── z_image_turbo_bf16.safetensors
│   └── 📂 vae/
│          └── ae.safetensors

Рабочий процесс ComfyUI

Вы можете скачать официальный шаблон рабочего процесса (workflow) по следующей ссылке:

Официальный workflow Z-Image-Turbo

Планы на будущее

Исследовательская команда планирует выпустить полную недистиллированную базовую модель, которая позволит сообществу проводить дообучение, создавать пользовательские рабочие процессы и развивать открытую экосистему.

Полезные ссылки

Модель на HuggingFace: https://huggingface.co/Tongyi-MAI/Z-Image-Turbo
Модель на Comfy-Org: https://huggingface.co/Comfy-Org/z_image_turbo
Блог ComfyUI: https://blog.comfy.org/p/z-image-turbo-in-comfyui-realism
Официальный сайт: https://z-image.ai