Alibaba Tongyi Lab lance Z-Image-Turbo - Un modèle efficace de génération d’images à 6B paramètres
Le 27 novembre 2025, Alibaba Tongyi Lab a officiellement lancé Z-Image-Turbo, un modèle de génération d’images de nouvelle génération hautement efficace. Avec seulement 6B paramètres, ce modèle atteint des performances comparables aux modèles phares propriétaires de plus de 20B paramètres, excellant particulièrement dans la génération de portraits photoréalistes haute fidélité.
Caractéristiques principales
Architecture de paramètres efficace
Z-Image-Turbo utilise une architecture DiT à flux unique évolutif (S3-DiT) qui concatène les tokens de texte, les tokens sémantiques visuels et les tokens VAE d’image au niveau de la séquence en un flux d’entrée unifié, maximisant l’efficacité des paramètres. Cette conception permet au modèle de maintenir une sortie de haute qualité tout en réduisant considérablement les besoins en ressources de calcul.
Compatible avec les GPU grand public
C’est l’une des caractéristiques les plus attrayantes de Z-Image-Turbo :
- Utilisation de VRAM strictement contrôlée à moins de 16 Go
- Génère des images de résolution 1024×1024 en seulement 2,3 secondes sur RTX 4090
- Génère des images 2K en seulement 4,8 secondes sur NVIDIA RTX Pro 6000 Blackwell
- Produit des images de haute qualité en seulement 8 étapes d’échantillonnage
- Peut même fonctionner sur RTX 3060 version 6 Go
Excellent rendu de texte
Z-Image-Turbo excelle dans le rendu de texte en chinois et en anglais, capable de :
- Rendre avec précision des textes complexes en chinois et en anglais
- Maintenir le réalisme facial et l’esthétique visuelle
- Obtenir des résultats comparables aux meilleurs modèles propriétaires
Portraits photoréalistes
Le modèle excelle particulièrement dans la génération de :
- Portraits de personnages haute fidélité
- Textures de peau naturelles et effets d’éclairage
- Éclairage et composition cinématographiques
- Divers styles de photographie de portrait
Utilisation dans ComfyUI
Z-Image-Turbo est maintenant pris en charge dans ComfyUI. Vous devez :
- Mettre à jour ComfyUI vers la dernière version
- Télécharger les fichiers de modèle requis
- Importer le flux de travail (workflow) pour commencer à utiliser
Fichiers du modèle
Vous devez télécharger les fichiers de modèle suivants et les placer dans les répertoires correspondants :
Encodeurs de texte (text_encoders)
Modèles de diffusion (diffusion_models)
VAE
Emplacement de stockage des fichiers
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 text_encoders/
│ │ └── qwen_3_4b.safetensors
│ ├── 📂 diffusion_models/
│ │ └── z_image_turbo_bf16.safetensors
│ └── 📂 vae/
│ └── ae.safetensorsFlux de travail ComfyUI
Vous pouvez télécharger le modèle de flux de travail (workflow) officiel depuis le lien suivant :
Plans futurs
L’équipe de recherche prévoit de publier le modèle de base complet non distillé, qui permettra l’affinage piloté par la communauté, les flux de travail personnalisés et un développement plus large de l’écosystème open source.
Liens connexes
- Modèle HuggingFace : https://huggingface.co/Tongyi-MAI/Z-Image-Turbo
- Modèle Comfy-Org : https://huggingface.co/Comfy-Org/z_image_turbo
- Blog ComfyUI : https://blog.comfy.org/p/z-image-turbo-in-comfyui-realism
- Site web officiel : https://z-image.ai