Alibaba Tongyi Lab Lance Z-Image-Base - Modèle de Génération d'Images Haute Qualité Non Distillé

Le 28 janvier 2026, Alibaba Tongyi Lab a officiellement lancé le modèle Z-Image-Base, la version checkpoint brute non distillée de la série Z-Image. ComfyUI a fourni un support complet le jour du lancement, réalisant une intégration Day-0.

Positionnement du Modèle

Z-Image-Base est la base centrale de la famille de modèles Z-Image. Contrairement à son homologue distillé Z-Image-Turbo qui privilégie la vitesse, la version Base préserve le plein potentiel génératif de l'architecture. Bien qu'il nécessite 30-50 étapes d'échantillonnage (CFG 3-5) pour une qualité optimale et des temps de génération plus longs, il produit des détails visuels significativement plus riches et un plafond artistique plus élevé.

Caractéristiques Principales

Esthétique Diverse

Z-Image-Base prend en charge une gamme plus large de styles artistiques tout en maintenant une qualité photoréaliste exceptionnelle. Par rapport à la version distillée, le modèle de base présente des avantages clairs en termes d'expressivité artistique et de diversité de styles.

Adapté au Fine-tuning

En tant que modèle complet non distillé, Z-Image-Base est une base idéale pour le fine-tuning communautaire et le développement spécialisé. Les développeurs peuvent entraîner des LoRAs basés sur ce modèle, effectuer un transfert de style ou créer des solutions de génération d'images personnalisées.

Haute Réactivité aux Prompts Négatifs

Le modèle est hautement réactif aux prompts négatifs, permettant un contrôle de génération précis. Les utilisateurs peuvent efficacement éviter les éléments ou styles indésirables grâce aux prompts négatifs.

Diversité Améliorée

Par rapport à la version distillée, le modèle Base présente une plus grande diversité de génération, produisant des résultats plus créatifs et variés, adaptés aux scénarios de création exploratoire.

Performance

Sur GPU NVIDIA RTX Pro 6000 Blackwell, générer une image de résolution 1024×1024 (30 étapes d'échantillonnage) ne prend que 13,3 secondes.

Utilisation dans ComfyUI

ComfyUI a fourni un support complet le jour du lancement de Z-Image-Base. Étapes d'utilisation :

Mettre à jour ComfyUI : Assurez-vous d'exécuter la dernière version de ComfyUI
Accéder aux Modèles de Workflow :
- Cliquez sur Templates dans la barre latérale
- Allez dans Template library
- Recherchez les workflows "Z-image"

Workflow Officiel

Vous pouvez télécharger le modèle de workflow officiel depuis :

Workflow Officiel Z-Image

Fichiers du Modèle

Les fichiers du modèle doivent être téléchargés et placés dans les répertoires correspondants :

Encodeurs de Texte (text_encoders)

qwen_3_4b.safetensors

Modèles de Diffusion (diffusion_models)

z_image_base_bf16.safetensors

VAE

ae.safetensors

Emplacement des Fichiers

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 text_encoders/
│   │      └── qwen_3_4b.safetensors
│   ├── 📂 diffusion_models/
│   │      └── z_image_base_bf16.safetensors
│   └── 📂 vae/
│          └── ae.safetensors

Paramètres Recommandés

Étapes d'Échantillonnage : 30-50 étapes
Échelle CFG : 3-5
Résolution : 1024×1024 (recommandé)

Scénarios d'Application

Z-Image-Base est particulièrement adapté pour :

Portraits de Qualité Photographique Professionnelle : Textures de peau fines, effets d'éclairage naturels
Architecture et Design d'Intérieur : Rendu spatial de haute qualité, représentation des matériaux
Création Artistique : Exploration de styles divers, expérimentation créative
Design Visuel Commercial : Photographie de produits, production de matériel publicitaire
Base pour Fine-tuning de Modèles : Entraînement LoRA, personnalisation de styles

Comparaison avec Z-Image-Turbo

--|

Écosystème de la Série Z-Image

La série Z-Image a formé un écosystème complet :

Z-Image-Base : Modèle fondamental non distillé, qualité et flexibilité maximales
Z-Image-Turbo : Version accélérée distillée, génération rapide en 8 étapes
Z-Image-Edit : Version spécialisée en édition d'images (à venir)
ControlNet Union 2.1 : Prend en charge plusieurs conditions de contrôle (Canny, HED, Depth, Pose, MLSD)
Version Accélérée TwinFlow : Version expérimentale plus rapide (en développement)

Liens Connexes

Dépôt GitHub : https://github.com/Tongyi-MAI/Z-Image
Modèle HuggingFace : https://huggingface.co/Tongyi-MAI/Z-Image
Modèle ModelScope : https://modelscope.cn/models/Tongyi-MAI/Z-Image
Blog ComfyUI : https://blog.comfy.org/p/z-image-day-0-support-in-comfyui
Site Web Officiel : https://z-image.ai