Guía de Uso del Workflow Nativo Qwen-Image-2512 para ComfyUI
Qwen-Image-2512 es la actualización de diciembre de 2024 del modelo Qwen-Image lanzada por el laboratorio Tongyi de Alibaba. En comparación con la versión base lanzada en agosto, esta nueva versión incluye múltiples mejoras en la calidad de generación de imágenes.
Mejoras Principales:
- Realismo Humano Mejorado: Las imágenes humanas generadas se ven más realistas y naturales, con menos artefactos obvios generados por IA
- Detalle Natural Más Fino: Renderizado más detallado de paisajes, pelo de animales y otros elementos naturales
- Renderizado de Texto Mejorado: El texto en las imágenes generadas es más claro y preciso, con mejor integración entre texto e imágenes
Recursos Relacionados:
- Página del Proyecto en GitHub
- Página del Modelo en Hugging Face
- Repositorio de Modelos en ModelScope
Guía del Workflow Nativo Qwen-Image-2512 para ComfyUI
El workflow incluye dos subgráficos:
- Text to Image (Qwen-Image 2512): Proceso de generación estándar de 50 pasos
- Text to Image (Qwen-Image 2512 4steps): Generación rápida de 4 pasos usando Lightning LoRA
1. Archivo de Workflow
Después de actualizar ComfyUI, puedes encontrar el archivo de workflow en las plantillas, o arrastrar el archivo de workflow a continuación a ComfyUI para cargarlo.
2. Descarga de Modelos
Todos los archivos de modelos se pueden encontrar en Hugging Face o ModelScope.
Codificadores de Texto
Modelo LoRA (Opcional - para aceleración de 4 pasos)
Si deseas una velocidad de generación más rápida, puedes usar Lightning LoRA para reducir los pasos de generación de 50 a 4:
Modelos de Difusión
Puedes elegir uno de los siguientes dos modelos según tus necesidades:
- qwen_image_2512_fp8_e4m3fn.safetensors (Recomendado para la mayoría de usuarios)
- qwen_image_2512_bf16.safetensors (Si tienes suficiente VRAM y deseas mejor calidad de imagen, puedes elegir esta versión)
Modelo VAE
3. Ubicación de Almacenamiento de Archivos de Modelos
Después de descargar, por favor coloca los archivos de modelos de acuerdo a la siguiente estructura de directorios:
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 text_encoders/
│ │ └── qwen_2.5_vl_7b_fp8_scaled.safetensors
│ ├── 📂 loras/
│ │ └── Qwen-Image-Lightning-4steps-V1.0.safetensors (Opcional)
│ ├── 📂 diffusion_models/
│ │ ├── qwen_image_2512_fp8_e4m3fn.safetensors (o qwen_image_2512_bf16.safetensors)
│ └── 📂 vae/
│ └── qwen_image_vae.safetensors4. Proporciones de Imagen Soportadas
Qwen-Image-2512 soporta múltiples proporciones de imagen. Puedes elegir el tamaño apropiado según tus necesidades:
| Proporción | Resolución |
|---|---|
| 1:1 | 1328×1328 |
| 16:9 | 1664×928 |
| 9:16 | 928×1664 |
| 4:3 | 1472×1104 |
| 3:4 | 1104×1472 |
| 3:2 | 1584×1056 |
| 2:3 | 1056×1584 |
Consejo: Si deseas una velocidad de generación más rápida, puedes usar la versión Lightning LoRA de 4 pasos. Aunque la generación es más rápida, la calidad de imagen puede ser ligeramente diferente. Recomendamos elegir la versión apropiada según tus necesidades reales.