Alibaba Tongyi Lab Lanza Z-Image-Base - Modelo de Generación de Imágenes de Alta Calidad No Destilado
El 28 de enero de 2026, Alibaba Tongyi Lab lanzó oficialmente el modelo Z-Image-Base, la versión de checkpoint crudo no destilado de la serie Z-Image. ComfyUI proporcionó soporte completo el día del lanzamiento, logrando una integración Day-0.
Posicionamiento del Modelo
Z-Image-Base es la base central de la familia de modelos Z-Image. A diferencia de su contraparte destilada Z-Image-Turbo que prioriza la velocidad, la versión Base preserva el potencial generativo completo de la arquitectura. Aunque requiere 30-50 pasos de muestreo (CFG 3-5) para una calidad óptima y tiempos de generación más largos, produce detalles visuales significativamente más ricos y un techo artístico más alto.
Características Principales
Estética Diversa
Z-Image-Base admite una gama más amplia de estilos artísticos mientras mantiene una calidad fotorrealista excepcional. En comparación con la versión destilada, el modelo base tiene ventajas claras en expresividad artística y diversidad de estilos.
Amigable para Ajuste Fino
Como modelo completo no destilado, Z-Image-Base es una base ideal para el ajuste fino de la comunidad y el desarrollo especializado. Los desarrolladores pueden entrenar LoRAs basados en este modelo, realizar transferencia de estilo o crear soluciones de generación de imágenes personalizadas.
Alta Respuesta a Prompts Negativos
El modelo es altamente receptivo a los prompts negativos, permitiendo un control de generación preciso. Los usuarios pueden evitar efectivamente elementos o estilos no deseados a través de prompts negativos.
Diversidad Mejorada
En comparación con la versión destilada, el modelo Base tiene mayor diversidad de generación, produciendo resultados más creativos y variados, adecuados para escenarios de creación exploratoria.
Rendimiento
En GPU NVIDIA RTX Pro 6000 Blackwell, generar una imagen de resolución 1024×1024 (30 pasos de muestreo) toma solo 13.3 segundos.
Uso en ComfyUI
ComfyUI proporcionó soporte completo el día del lanzamiento de Z-Image-Base. Pasos de uso:
- Actualizar ComfyUI: Asegúrese de estar ejecutando la última versión de ComfyUI
- Acceder a Plantillas de Flujo de Trabajo:
- Haga clic en Templates en la barra lateral
- Vaya a Template library
- Busque flujos de trabajo “Z-image”
Flujo de Trabajo Oficial
Puede descargar la plantilla de flujo de trabajo oficial desde:
Archivos del Modelo
Los archivos del modelo deben descargarse y colocarse en los directorios correspondientes:
Codificadores de Texto (text_encoders)
- qwen_3_4b.safetensors
Modelos de Difusión (diffusion_models)
- z_image_base_bf16.safetensors
VAE
- ae.safetensors
Ubicación de Archivos
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 text_encoders/
│ │ └── qwen_3_4b.safetensors
│ ├── 📂 diffusion_models/
│ │ └── z_image_base_bf16.safetensors
│ └── 📂 vae/
│ └── ae.safetensorsParámetros Recomendados
- Pasos de Muestreo: 30-50 pasos
- Escala CFG: 3-5
- Resolución: 1024×1024 (recomendado)
Escenarios de Aplicación
Z-Image-Base es particularmente adecuado para:
- Retratos de Grado Fotográfico Profesional: Texturas de piel finas, efectos de iluminación naturales
- Arquitectura y Diseño de Interiores: Renderizado espacial de alta calidad, representación de materiales
- Creación Artística: Exploración de estilos diversos, experimentación creativa
- Diseño Visual Comercial: Fotografía de productos, producción de materiales publicitarios
- Base para Ajuste Fino de Modelos: Entrenamiento de LoRA, personalización de estilos
Comparación con Z-Image-Turbo
| Característica | Z-Image-Base | Z-Image-Turbo |
|---|---|---|
| Pasos de Muestreo | 30-50 pasos | 8 pasos |
| Velocidad de Generación | Más lenta | Muy rápida |
| Detalles Visuales | Más ricos | Excelentes |
| Techo Artístico | Más alto | Alto |
| Diversidad de Generación | Más fuerte | Buena |
| Amigabilidad para Ajuste Fino | Excelente | Regular |
| Respuesta a Prompt Negativo | Altamente receptivo | Receptivo |
| Casos de Uso | Creación profesional, Desarrollo de ajuste fino | Prototipado rápido, Creación diaria |
Ecosistema de la Serie Z-Image
La serie Z-Image ha formado un ecosistema completo:
- Z-Image-Base: Modelo fundacional no destilado, máxima calidad y flexibilidad
- Z-Image-Turbo: Versión acelerada destilada, generación rápida de 8 pasos
- Z-Image-Edit: Versión especializada en edición de imágenes (próximamente)
- ControlNet Union 2.1: Admite múltiples condiciones de control (Canny, HED, Depth, Pose, MLSD)
- Versión Acelerada TwinFlow: Versión experimental más rápida (en desarrollo)
Enlaces Relacionados
- Repositorio GitHub: https://github.com/Tongyi-MAI/Z-Image
- Modelo HuggingFace: https://huggingface.co/Tongyi-MAI/Z-Image
- Modelo ModelScope: https://modelscope.cn/models/Tongyi-MAI/Z-Image
- Blog ComfyUI: https://blog.comfy.org/p/z-image-day-0-support-in-comfyui
- Sitio Web Oficial: https://z-image.ai