Alibaba Tongyi Lab lance Z-Image-Turbo - Un modèle efficace de génération d'images à 6B paramètres

Le 27 novembre 2025, Alibaba Tongyi Lab a officiellement lancé Z-Image-Turbo, un modèle de génération d'images de nouvelle génération hautement efficace. Avec seulement 6B paramètres, ce modèle atteint des performances comparables aux modèles phares propriétaires de plus de 20B paramètres, excellant particulièrement dans la génération de portraits photoréalistes haute fidélité.

Caractéristiques principales

Architecture de paramètres efficace

Z-Image-Turbo utilise une architecture DiT à flux unique évolutif (S3-DiT) qui concatène les tokens de texte, les tokens sémantiques visuels et les tokens VAE d'image au niveau de la séquence en un flux d'entrée unifié, maximisant l'efficacité des paramètres. Cette conception permet au modèle de maintenir une sortie de haute qualité tout en réduisant considérablement les besoins en ressources de calcul.

Compatible avec les GPU grand public

C'est l'une des caractéristiques les plus attrayantes de Z-Image-Turbo :

Utilisation de VRAM strictement contrôlée à moins de 16 Go
Génère des images de résolution 1024×1024 en seulement 2,3 secondes sur RTX 4090
Génère des images 2K en seulement 4,8 secondes sur NVIDIA RTX Pro 6000 Blackwell
Produit des images de haute qualité en seulement 8 étapes d'échantillonnage
Peut même fonctionner sur RTX 3060 version 6 Go

Excellent rendu de texte

Z-Image-Turbo excelle dans le rendu de texte en chinois et en anglais, capable de :

Rendre avec précision des textes complexes en chinois et en anglais
Maintenir le réalisme facial et l'esthétique visuelle
Obtenir des résultats comparables aux meilleurs modèles propriétaires

Portraits photoréalistes

Le modèle excelle particulièrement dans la génération de :

Portraits de personnages haute fidélité
Textures de peau naturelles et effets d'éclairage
Éclairage et composition cinématographiques
Divers styles de photographie de portrait

Utilisation dans ComfyUI

Z-Image-Turbo est maintenant pris en charge dans ComfyUI. Vous devez :

Mettre à jour ComfyUI vers la dernière version
Télécharger les fichiers de modèle requis
Importer le flux de travail (workflow) pour commencer à utiliser

Fichiers du modèle

Vous devez télécharger les fichiers de modèle suivants et les placer dans les répertoires correspondants :

Encodeurs de texte (text_encoders)

qwen_3_4b.safetensors

Modèles de diffusion (diffusion_models)

z_image_turbo_bf16.safetensors

VAE

ae.safetensors

Emplacement de stockage des fichiers

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 text_encoders/
│   │      └── qwen_3_4b.safetensors
│   ├── 📂 diffusion_models/
│   │      └── z_image_turbo_bf16.safetensors
│   └── 📂 vae/
│          └── ae.safetensors

Flux de travail ComfyUI

Vous pouvez télécharger le modèle de flux de travail (workflow) officiel depuis le lien suivant :

Flux de travail officiel Z-Image-Turbo

Plans futurs

L'équipe de recherche prévoit de publier le modèle de base complet non distillé, qui permettra l'affinage piloté par la communauté, les flux de travail personnalisés et un développement plus large de l'écosystème open source.

Liens connexes

Modèle HuggingFace : https://huggingface.co/Tongyi-MAI/Z-Image-Turbo
Modèle Comfy-Org : https://huggingface.co/Comfy-Org/z_image_turbo
Blog ComfyUI : https://blog.comfy.org/p/z-image-turbo-in-comfyui-realism
Site web officiel : https://z-image.ai