Skip to content
Follow me on X
ComfyUI Wiki
NoticiasAlibaba Tongyi Lab Lanza Z-Image-Base - Modelo de Generación de Imágenes de Alta Calidad No Destilado

Alibaba Tongyi Lab Lanza Z-Image-Base - Modelo de Generación de Imágenes de Alta Calidad No Destilado

El 28 de enero de 2026, Alibaba Tongyi Lab lanzó oficialmente el modelo Z-Image-Base, la versión de checkpoint crudo no destilado de la serie Z-Image. ComfyUI proporcionó soporte completo el día del lanzamiento, logrando una integración Day-0.

Posicionamiento del Modelo

Z-Image-Base es la base central de la familia de modelos Z-Image. A diferencia de su contraparte destilada Z-Image-Turbo que prioriza la velocidad, la versión Base preserva el potencial generativo completo de la arquitectura. Aunque requiere 30-50 pasos de muestreo (CFG 3-5) para una calidad óptima y tiempos de generación más largos, produce detalles visuales significativamente más ricos y un techo artístico más alto.

Características Principales

Estética Diversa

Z-Image-Base admite una gama más amplia de estilos artísticos mientras mantiene una calidad fotorrealista excepcional. En comparación con la versión destilada, el modelo base tiene ventajas claras en expresividad artística y diversidad de estilos.

Amigable para Ajuste Fino

Como modelo completo no destilado, Z-Image-Base es una base ideal para el ajuste fino de la comunidad y el desarrollo especializado. Los desarrolladores pueden entrenar LoRAs basados en este modelo, realizar transferencia de estilo o crear soluciones de generación de imágenes personalizadas.

Alta Respuesta a Prompts Negativos

El modelo es altamente receptivo a los prompts negativos, permitiendo un control de generación preciso. Los usuarios pueden evitar efectivamente elementos o estilos no deseados a través de prompts negativos.

Diversidad Mejorada

En comparación con la versión destilada, el modelo Base tiene mayor diversidad de generación, produciendo resultados más creativos y variados, adecuados para escenarios de creación exploratoria.

Rendimiento

En GPU NVIDIA RTX Pro 6000 Blackwell, generar una imagen de resolución 1024×1024 (30 pasos de muestreo) toma solo 13.3 segundos.

Uso en ComfyUI

ComfyUI proporcionó soporte completo el día del lanzamiento de Z-Image-Base. Pasos de uso:

  1. Actualizar ComfyUI: Asegúrese de estar ejecutando la última versión de ComfyUI
  2. Acceder a Plantillas de Flujo de Trabajo:
    • Haga clic en Templates en la barra lateral
    • Vaya a Template library
    • Busque flujos de trabajo “Z-image”

Flujo de Trabajo Oficial

Puede descargar la plantilla de flujo de trabajo oficial desde:

Archivos del Modelo

Los archivos del modelo deben descargarse y colocarse en los directorios correspondientes:

Codificadores de Texto (text_encoders)

  • qwen_3_4b.safetensors

Modelos de Difusión (diffusion_models)

  • z_image_base_bf16.safetensors

VAE

  • ae.safetensors

Ubicación de Archivos

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 text_encoders/
│   │      └── qwen_3_4b.safetensors
│   ├── 📂 diffusion_models/
│   │      └── z_image_base_bf16.safetensors
│   └── 📂 vae/
│          └── ae.safetensors

Parámetros Recomendados

  • Pasos de Muestreo: 30-50 pasos
  • Escala CFG: 3-5
  • Resolución: 1024×1024 (recomendado)

Escenarios de Aplicación

Z-Image-Base es particularmente adecuado para:

  • Retratos de Grado Fotográfico Profesional: Texturas de piel finas, efectos de iluminación naturales
  • Arquitectura y Diseño de Interiores: Renderizado espacial de alta calidad, representación de materiales
  • Creación Artística: Exploración de estilos diversos, experimentación creativa
  • Diseño Visual Comercial: Fotografía de productos, producción de materiales publicitarios
  • Base para Ajuste Fino de Modelos: Entrenamiento de LoRA, personalización de estilos

Comparación con Z-Image-Turbo

CaracterísticaZ-Image-BaseZ-Image-Turbo
Pasos de Muestreo30-50 pasos8 pasos
Velocidad de GeneraciónMás lentaMuy rápida
Detalles VisualesMás ricosExcelentes
Techo ArtísticoMás altoAlto
Diversidad de GeneraciónMás fuerteBuena
Amigabilidad para Ajuste FinoExcelenteRegular
Respuesta a Prompt NegativoAltamente receptivoReceptivo
Casos de UsoCreación profesional, Desarrollo de ajuste finoPrototipado rápido, Creación diaria

Ecosistema de la Serie Z-Image

La serie Z-Image ha formado un ecosistema completo:

  • Z-Image-Base: Modelo fundacional no destilado, máxima calidad y flexibilidad
  • Z-Image-Turbo: Versión acelerada destilada, generación rápida de 8 pasos
  • Z-Image-Edit: Versión especializada en edición de imágenes (próximamente)
  • ControlNet Union 2.1: Admite múltiples condiciones de control (Canny, HED, Depth, Pose, MLSD)
  • Versión Acelerada TwinFlow: Versión experimental más rápida (en desarrollo)

Enlaces Relacionados