Tutorial de Workflow Qwen-Image-2512 para ComfyUI

Qwen-Image-2512 es la actualización de diciembre de 2024 del modelo Qwen-Image lanzada por el laboratorio Tongyi de Alibaba. En comparación con la versión base lanzada en agosto, esta nueva versión incluye múltiples mejoras en la calidad de generación de imágenes.

Mejoras Principales:

Realismo Humano Mejorado: Las imágenes humanas generadas se ven más realistas y naturales, con menos artefactos obvios generados por IA
Detalle Natural Más Fino: Renderizado más detallado de paisajes, pelo de animales y otros elementos naturales
Renderizado de Texto Mejorado: El texto en las imágenes generadas es más claro y preciso, con mejor integración entre texto e imágenes

Recursos Relacionados:

Guía del Workflow Nativo Qwen-Image-2512 para ComfyUI

El workflow incluye dos subgráficos:

Text to Image (Qwen-Image 2512): Proceso de generación estándar de 50 pasos
Text to Image (Qwen-Image 2512 4steps): Generación rápida de 4 pasos usando Lightning LoRA

1. Archivo de Workflow

Después de actualizar ComfyUI, puedes encontrar el archivo de workflow en las plantillas, o arrastrar el archivo de workflow a continuación a ComfyUI para cargarlo.

2. Descarga de Modelos

Todos los archivos de modelos se pueden encontrar en Hugging Face o ModelScope.

Codificadores de Texto

qwen_2.5_vl_7b_fp8_scaled.safetensors

Modelo LoRA (Opcional - para aceleración de 4 pasos)

Si deseas una velocidad de generación más rápida, puedes usar Lightning LoRA para reducir los pasos de generación de 50 a 4:

Qwen-Image-Lightning-4steps-V1.0.safetensors

Modelos de Difusión

Puedes elegir uno de los siguientes dos modelos según tus necesidades:

qwen_image_2512_fp8_e4m3fn.safetensors (Recomendado para la mayoría de usuarios)
qwen_image_2512_bf16.safetensors (Si tienes suficiente VRAM y deseas mejor calidad de imagen, puedes elegir esta versión)

Modelo VAE

qwen_image_vae.safetensors

3. Ubicación de Almacenamiento de Archivos de Modelos

Después de descargar, por favor coloca los archivos de modelos de acuerdo a la siguiente estructura de directorios:

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 text_encoders/
│   │   └── qwen_2.5_vl_7b_fp8_scaled.safetensors
│   ├── 📂 loras/
│   │   └── Qwen-Image-Lightning-4steps-V1.0.safetensors  (Opcional)
│   ├── 📂 diffusion_models/
│   │   ├── qwen_image_2512_fp8_e4m3fn.safetensors        (o qwen_image_2512_bf16.safetensors)
│   └── 📂 vae/
│       └── qwen_image_vae.safetensors

4. Proporciones de Imagen Soportadas

Qwen-Image-2512 soporta múltiples proporciones de imagen. Puedes elegir el tamaño apropiado según tus necesidades:

Proporción	Resolución
1:1	1328×1328
16:9	1664×928
9:16	928×1664
4:3	1472×1104
3:4	1104×1472
3:2	1584×1056
2:3	1056×1584

Consejo: Si deseas una velocidad de generación más rápida, puedes usar la versión Lightning LoRA de 4 pasos. Aunque la generación es más rápida, la calidad de imagen puede ser ligeramente diferente. Recomendamos elegir la versión apropiada según tus necesidades reales.

Guía del Workflow Nativo Qwen-Image-2512 para ComfyUI

1. Archivo de Workflow

2. Descarga de Modelos

3. Ubicación de Almacenamiento de Archivos de Modelos

4. Proporciones de Imagen Soportadas

Comentarios