Alibaba Tongyi Lab выпустила Z-Image-Turbo — эффективную модель генерации изображений с 6B параметрами
27 ноября 2025 года Alibaba Tongyi Lab официально выпустила Z-Image-Turbo — высокоэффективную модель генерации изображений нового поколения. Имея всего 6B параметров, эта модель достигает производительности, сопоставимой с закрытыми флагманскими моделями с более чем 20B параметрами, особенно преуспевая в генерации высококачественных фотореалистичных портретов.
Основные особенности
Эффективная архитектура параметров
Z-Image-Turbo использует масштабируемую однопоточную архитектуру DiT (S3-DiT), которая объединяет текстовые, визуально-семантические токены и токены VAE изображения на уровне последовательности в единый входной поток, максимизируя эффективность параметров. Такой дизайн позволяет модели поддерживать высокое качество выходных данных при значительном снижении требований к вычислительным ресурсам.
Совместимость с потребительскими GPU
Это одна из самых привлекательных особенностей Z-Image-Turbo:
- Использование видеопамяти строго контролируется на уровне менее 16 ГБ
- Генерация изображений разрешением 1024×1024 всего за 2,3 секунды на RTX 4090
- Генерация изображений 2K всего за 4,8 секунды на NVIDIA RTX Pro 6000 Blackwell
- Создание качественных изображений всего за 8 шагов сэмплирования
- Может работать даже на RTX 3060 с 6 ГБ видеопамяти
Отличный рендеринг текста
Z-Image-Turbo превосходно справляется с рендерингом текста на китайском и английском языках:
- Точный рендеринг сложного китайского и английского текста
- Сохранение реалистичности лиц и визуальной эстетики
- Результаты, сопоставимые с лучшими закрытыми моделями
Фотореалистичные портреты
Модель особенно хорошо справляется с генерацией:
- Высококачественных портретов персонажей
- Естественных текстур кожи и световых эффектов
- Кинематографического освещения и композиции
- Различных стилей портретной фотографии
Использование в ComfyUI
Z-Image-Turbo теперь поддерживается в ComfyUI. Вам необходимо:
- Обновить ComfyUI до последней версии
- Скачать необходимые файлы модели
- Импортировать рабочий процесс (workflow) для начала работы
Файлы модели
Вам нужно скачать следующие файлы модели и разместить их в соответствующих директориях:
Текстовые энкодеры (text_encoders)
Диффузионные модели (diffusion_models)
VAE
Расположение файлов
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 text_encoders/
│ │ └── qwen_3_4b.safetensors
│ ├── 📂 diffusion_models/
│ │ └── z_image_turbo_bf16.safetensors
│ └── 📂 vae/
│ └── ae.safetensorsРабочий процесс ComfyUI
Вы можете скачать официальный шаблон рабочего процесса (workflow) по следующей ссылке:
Планы на будущее
Исследовательская команда планирует выпустить полную недистиллированную базовую модель, которая позволит сообществу проводить дообучение, создавать пользовательские рабочие процессы и развивать открытую экосистему.
Полезные ссылки
- Модель на HuggingFace: https://huggingface.co/Tongyi-MAI/Z-Image-Turbo
- Модель на Comfy-Org: https://huggingface.co/Comfy-Org/z_image_turbo
- Блог ComfyUI: https://blog.comfy.org/p/z-image-turbo-in-comfyui-realism
- Официальный сайт: https://z-image.ai