Skip to content
Follow me on X
ComfyUI Wiki
ActualitésAlibaba Tongyi Lab Lance Z-Image-Base - Modèle de Génération d'Images Haute Qualité Non Distillé
Aucun article pour le moment. Revenez plus tard !

Alibaba Tongyi Lab Lance Z-Image-Base - Modèle de Génération d’Images Haute Qualité Non Distillé

Le 28 janvier 2026, Alibaba Tongyi Lab a officiellement lancé le modèle Z-Image-Base, la version checkpoint brute non distillée de la série Z-Image. ComfyUI a fourni un support complet le jour du lancement, réalisant une intégration Day-0.

Positionnement du Modèle

Z-Image-Base est la base centrale de la famille de modèles Z-Image. Contrairement à son homologue distillé Z-Image-Turbo qui privilégie la vitesse, la version Base préserve le plein potentiel génératif de l’architecture. Bien qu’il nécessite 30-50 étapes d’échantillonnage (CFG 3-5) pour une qualité optimale et des temps de génération plus longs, il produit des détails visuels significativement plus riches et un plafond artistique plus élevé.

Caractéristiques Principales

Esthétique Diverse

Z-Image-Base prend en charge une gamme plus large de styles artistiques tout en maintenant une qualité photoréaliste exceptionnelle. Par rapport à la version distillée, le modèle de base présente des avantages clairs en termes d’expressivité artistique et de diversité de styles.

Adapté au Fine-tuning

En tant que modèle complet non distillé, Z-Image-Base est une base idéale pour le fine-tuning communautaire et le développement spécialisé. Les développeurs peuvent entraîner des LoRAs basés sur ce modèle, effectuer un transfert de style ou créer des solutions de génération d’images personnalisées.

Haute Réactivité aux Prompts Négatifs

Le modèle est hautement réactif aux prompts négatifs, permettant un contrôle de génération précis. Les utilisateurs peuvent efficacement éviter les éléments ou styles indésirables grâce aux prompts négatifs.

Diversité Améliorée

Par rapport à la version distillée, le modèle Base présente une plus grande diversité de génération, produisant des résultats plus créatifs et variés, adaptés aux scénarios de création exploratoire.

Performance

Sur GPU NVIDIA RTX Pro 6000 Blackwell, générer une image de résolution 1024×1024 (30 étapes d’échantillonnage) ne prend que 13,3 secondes.

Utilisation dans ComfyUI

ComfyUI a fourni un support complet le jour du lancement de Z-Image-Base. Étapes d’utilisation :

  1. Mettre à jour ComfyUI : Assurez-vous d’exécuter la dernière version de ComfyUI
  2. Accéder aux Modèles de Workflow :
    • Cliquez sur Templates dans la barre latérale
    • Allez dans Template library
    • Recherchez les workflows “Z-image”

Workflow Officiel

Vous pouvez télécharger le modèle de workflow officiel depuis :

Fichiers du Modèle

Les fichiers du modèle doivent être téléchargés et placés dans les répertoires correspondants :

Encodeurs de Texte (text_encoders)

  • qwen_3_4b.safetensors

Modèles de Diffusion (diffusion_models)

  • z_image_base_bf16.safetensors

VAE

  • ae.safetensors

Emplacement des Fichiers

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 text_encoders/
│   │      └── qwen_3_4b.safetensors
│   ├── 📂 diffusion_models/
│   │      └── z_image_base_bf16.safetensors
│   └── 📂 vae/
│          └── ae.safetensors

Paramètres Recommandés

  • Étapes d’Échantillonnage : 30-50 étapes
  • Échelle CFG : 3-5
  • Résolution : 1024×1024 (recommandé)

Scénarios d’Application

Z-Image-Base est particulièrement adapté pour :

  • Portraits de Qualité Photographique Professionnelle : Textures de peau fines, effets d’éclairage naturels
  • Architecture et Design d’Intérieur : Rendu spatial de haute qualité, représentation des matériaux
  • Création Artistique : Exploration de styles divers, expérimentation créative
  • Design Visuel Commercial : Photographie de produits, production de matériel publicitaire
  • Base pour Fine-tuning de Modèles : Entraînement LoRA, personnalisation de styles

Comparaison avec Z-Image-Turbo

CaractéristiqueZ-Image-BaseZ-Image-Turbo
Étapes d’Échantillonnage30-50 étapes8 étapes
Vitesse de GénérationPlus lenteTrès rapide
Détails VisuelsPlus richesExcellents
Plafond ArtistiquePlus élevéÉlevé
Diversité de GénérationPlus forteBonne
Adaptabilité au Fine-tuningExcellenteCorrecte
Réponse au Prompt NégatifHautement réactifRéactif
Cas d’UsageCréation professionnelle, Développement de fine-tuningPrototypage rapide, Création quotidienne

Écosystème de la Série Z-Image

La série Z-Image a formé un écosystème complet :

  • Z-Image-Base : Modèle fondamental non distillé, qualité et flexibilité maximales
  • Z-Image-Turbo : Version accélérée distillée, génération rapide en 8 étapes
  • Z-Image-Edit : Version spécialisée en édition d’images (à venir)
  • ControlNet Union 2.1 : Prend en charge plusieurs conditions de contrôle (Canny, HED, Depth, Pose, MLSD)
  • Version Accélérée TwinFlow : Version expérimentale plus rapide (en développement)

Liens Connexes