Alibaba Tongyi Lab Lance Z-Image-Base - Modèle de Génération d’Images Haute Qualité Non Distillé
Le 28 janvier 2026, Alibaba Tongyi Lab a officiellement lancé le modèle Z-Image-Base, la version checkpoint brute non distillée de la série Z-Image. ComfyUI a fourni un support complet le jour du lancement, réalisant une intégration Day-0.
Positionnement du Modèle
Z-Image-Base est la base centrale de la famille de modèles Z-Image. Contrairement à son homologue distillé Z-Image-Turbo qui privilégie la vitesse, la version Base préserve le plein potentiel génératif de l’architecture. Bien qu’il nécessite 30-50 étapes d’échantillonnage (CFG 3-5) pour une qualité optimale et des temps de génération plus longs, il produit des détails visuels significativement plus riches et un plafond artistique plus élevé.
Caractéristiques Principales
Esthétique Diverse
Z-Image-Base prend en charge une gamme plus large de styles artistiques tout en maintenant une qualité photoréaliste exceptionnelle. Par rapport à la version distillée, le modèle de base présente des avantages clairs en termes d’expressivité artistique et de diversité de styles.
Adapté au Fine-tuning
En tant que modèle complet non distillé, Z-Image-Base est une base idéale pour le fine-tuning communautaire et le développement spécialisé. Les développeurs peuvent entraîner des LoRAs basés sur ce modèle, effectuer un transfert de style ou créer des solutions de génération d’images personnalisées.
Haute Réactivité aux Prompts Négatifs
Le modèle est hautement réactif aux prompts négatifs, permettant un contrôle de génération précis. Les utilisateurs peuvent efficacement éviter les éléments ou styles indésirables grâce aux prompts négatifs.
Diversité Améliorée
Par rapport à la version distillée, le modèle Base présente une plus grande diversité de génération, produisant des résultats plus créatifs et variés, adaptés aux scénarios de création exploratoire.
Performance
Sur GPU NVIDIA RTX Pro 6000 Blackwell, générer une image de résolution 1024×1024 (30 étapes d’échantillonnage) ne prend que 13,3 secondes.
Utilisation dans ComfyUI
ComfyUI a fourni un support complet le jour du lancement de Z-Image-Base. Étapes d’utilisation :
- Mettre à jour ComfyUI : Assurez-vous d’exécuter la dernière version de ComfyUI
- Accéder aux Modèles de Workflow :
- Cliquez sur Templates dans la barre latérale
- Allez dans Template library
- Recherchez les workflows “Z-image”
Workflow Officiel
Vous pouvez télécharger le modèle de workflow officiel depuis :
Fichiers du Modèle
Les fichiers du modèle doivent être téléchargés et placés dans les répertoires correspondants :
Encodeurs de Texte (text_encoders)
- qwen_3_4b.safetensors
Modèles de Diffusion (diffusion_models)
- z_image_base_bf16.safetensors
VAE
- ae.safetensors
Emplacement des Fichiers
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 text_encoders/
│ │ └── qwen_3_4b.safetensors
│ ├── 📂 diffusion_models/
│ │ └── z_image_base_bf16.safetensors
│ └── 📂 vae/
│ └── ae.safetensorsParamètres Recommandés
- Étapes d’Échantillonnage : 30-50 étapes
- Échelle CFG : 3-5
- Résolution : 1024×1024 (recommandé)
Scénarios d’Application
Z-Image-Base est particulièrement adapté pour :
- Portraits de Qualité Photographique Professionnelle : Textures de peau fines, effets d’éclairage naturels
- Architecture et Design d’Intérieur : Rendu spatial de haute qualité, représentation des matériaux
- Création Artistique : Exploration de styles divers, expérimentation créative
- Design Visuel Commercial : Photographie de produits, production de matériel publicitaire
- Base pour Fine-tuning de Modèles : Entraînement LoRA, personnalisation de styles
Comparaison avec Z-Image-Turbo
| Caractéristique | Z-Image-Base | Z-Image-Turbo |
|---|---|---|
| Étapes d’Échantillonnage | 30-50 étapes | 8 étapes |
| Vitesse de Génération | Plus lente | Très rapide |
| Détails Visuels | Plus riches | Excellents |
| Plafond Artistique | Plus élevé | Élevé |
| Diversité de Génération | Plus forte | Bonne |
| Adaptabilité au Fine-tuning | Excellente | Correcte |
| Réponse au Prompt Négatif | Hautement réactif | Réactif |
| Cas d’Usage | Création professionnelle, Développement de fine-tuning | Prototypage rapide, Création quotidienne |
Écosystème de la Série Z-Image
La série Z-Image a formé un écosystème complet :
- Z-Image-Base : Modèle fondamental non distillé, qualité et flexibilité maximales
- Z-Image-Turbo : Version accélérée distillée, génération rapide en 8 étapes
- Z-Image-Edit : Version spécialisée en édition d’images (à venir)
- ControlNet Union 2.1 : Prend en charge plusieurs conditions de contrôle (Canny, HED, Depth, Pose, MLSD)
- Version Accélérée TwinFlow : Version expérimentale plus rapide (en développement)
Liens Connexes
- Dépôt GitHub : https://github.com/Tongyi-MAI/Z-Image
- Modèle HuggingFace : https://huggingface.co/Tongyi-MAI/Z-Image
- Modèle ModelScope : https://modelscope.cn/models/Tongyi-MAI/Z-Image
- Blog ComfyUI : https://blog.comfy.org/p/z-image-day-0-support-in-comfyui
- Site Web Officiel : https://z-image.ai