Flujo de trabajo Wan2.1 ComfyUI
Wan2.1, lanzado como código abierto por Alibaba en febrero de 2025, es un modelo de referencia en el campo de la generación de videos, con licencia Apache 2.0. Ofrece dos versiones: 14B (14 mil millones de parámetros) y 1.3B (1.3 mil millones de parámetros), cubriendo tareas como texto a video (T2V), imagen a video (I2V) y más. Este modelo no solo supera a los modelos de código abierto existentes en rendimiento, sino que su versión ligera requiere solo 8GB de VRAM, reduciendo significativamente la barrera de entrada.
Actualmente, todos los modelos están disponibles para descargar en las plataformas Hugging Face y ModelScope:
- T2V-14B:Hugging Face | ModelScope
- I2V-14B-720P:Hugging Face | ModelScope
- T2V-1.3B:Hugging Face | ModelScope
Este artículo te guiará a través de los flujos de trabajo relacionados con Wan2.1, incluyendo:
- Instalación de los modelos Wan2.1
- Flujo de trabajo de imagen a video con Wan2.1
- Configuración del flujo de trabajo de texto a video con Wan2.1
Además, la comunidad ha creado versiones GGUF y cuantizadas:
- GGUF: https://huggingface.co/city96/Wan2.1-T2V-14B-gguf/tree/main
- Versión cuantizada: https://huggingface.co/Kijai/WanVideo_comfy/tree/main
Ejemplos oficiales de flujos de trabajo Wan2.1 ComfyUI
Los siguientes flujos de trabajo provienen del blog oficial de ComfyUI, ya que ComfyUI ahora soporta nativamente Wan2.1
1. Instalación relacionada con Wan2.1
- Actualiza ComfyUI a la última versión
Asegúrate de actualizar tu versión de ComfyUI a la más reciente, consulta la guía Cómo actualizar ComfyUI para completar la actualización.
- Instalación de modelos de difusión
Descarga una versión del modelo desde el repositorio reempaquetado de Comfy según el tipo de flujo de trabajo que necesites:
- i2v es para image to video (imagen a video), t2v es para text to video (texto a video)
- 14B y 1.3B representan la cantidad de parámetros; cuanto mayor sea el número, mayores serán los requisitos de hardware
- bf16, fp16, fp8 representan diferentes precisiones; mayor precisión significa mayores requisitos de hardware, siendo fp8 la precisión más baja con menores requisitos pero resultados relativamente inferiores
- Generalmente, cuanto mayor sea el tamaño del archivo, mayores serán los requisitos de hardware
Guarda los modelos descargados en el directorio ComfyUI/models/diffusion_models
- Instalación de modelos de codificadores de texto
Haz clic para descargar umt5_xxl_fp8_e4m3fn_scaled.safetensors
Si la descarga no responde, visita este enlace para descargar
Guarda el modelo descargado en el directorio ComfyUI/models/text_encoders
- Instalación de modelos clip_vision
Haz clic para descargar clip_vision_h.safetensors
Si la descarga no responde, visita este enlace para descargar
Guarda el modelo descargado en el directorio ComfyUI/models/clip_vision
- Instalación del modelo VAE de Wan2.1
Haz clic para descargar wan_2.1_vae.safetensors
Si la descarga no responde, visita este enlace para descargar
Guarda el modelo descargado en el directorio ComfyUI/models/vae
2. Flujo de trabajo de imagen a video con Wan2.1
Los siguientes dos flujos de trabajo tienen nodos básicos similares, con diferencias en el modelo de difusión utilizado y las dimensiones de video correspondientes. Puedes usar cualquiera de los archivos de flujo de trabajo proporcionados a continuación, o usar uno y modificar los parámetros según mis instrucciones.
2.1 Flujo de trabajo de imagen a video Wan2.1 14B 720P
Descarga del archivo de flujo de trabajo
Haz clic en el botón de abajo para descargar el flujo de trabajo correspondiente, luego arrástralo a la interfaz de ComfyUI o usa el menú Workflows
-> Open(Ctrl+O)
para cargarlo
Ejemplo de imagen de entrada
Descarga esta imagen para usarla como entrada
Explicación del flujo de trabajo de imagen a video Wan2.1 720P
Consulta los números en la imagen para asegurarte de que los nodos y modelos correspondientes estén cargados correctamente para que el modelo funcione normalmente
- Sube el ejemplo de imagen de entrada proporcionado anteriormente
- Asegúrate de que el modelo
[clip_vision_h.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/clip_vision/clip_vision_h.safetensors?download=true)
se pueda leer y cargar normalmente - Asegúrate de que el modelo
[umt5_xxl_fp8_e4m3fn_scaled.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/text_encoders/umt5_xxl_fp8_e4m3fn_scaled.safetensors?download=true)
se pueda leer y cargar normalmente - Asegúrate de usar el modelo 720P y que se pueda leer normalmente. Si no lo has descargado, haz clic aquí para descargarlo, uno de los siguientes dependiendo del rendimiento de tu dispositivo:
- wan2.1_i2v_720p_14B_bf16.safetensors
- wan2.1_i2v_720p_14B_fp8_e4m3fn.safetensors
- Asegúrate de que el modelo
[wan_2.1_vae.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/vae/wan_2.1_vae.safetensors?download=true)
se pueda leer y cargar normalmente - Haz clic en el botón
Queue
o usa el atajoCtrl(cmd) + Enter
para ejecutar la generación de video - Observa que el tamaño en el nodo
wanImageToVideo
es 768x768
2.2 Flujo de trabajo de imagen a video Wan2.1 14B 480P
El flujo de trabajo 480P es similar al de 720P, con la principal diferencia en el nodo LoadDiffusion Model
que carga el modelo 480P, y el nodo wanImageToVideo
con un tamaño de 512x512
Descarga del archivo de flujo de trabajo
Haz clic en el botón de abajo para descargar el flujo de trabajo correspondiente, luego arrástralo a la interfaz de ComfyUI o usa el menú Workflows
-> Open(Ctrl+O)
para cargarlo
Ejemplo de imagen de entrada
Descarga la siguiente imagen para usarla como entrada
Explicación del flujo de trabajo de imagen a video Wan2.1 480P
Explicación del flujo de trabajo de imagen a video Wan2.1 480P
Consulta los números en la imagen para asegurarte de que los nodos y modelos correspondientes estén cargados correctamente para que el modelo funcione normalmente
- Sube el ejemplo de imagen de entrada proporcionado anteriormente
- Asegúrate de que el modelo
[clip_vision_h.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/clip_vision/clip_vision_h.safetensors?download=true)
se pueda leer y cargar normalmente - Asegúrate de que el modelo
[umt5_xxl_fp8_e4m3fn_scaled.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/text_encoders/umt5_xxl_fp8_e4m3fn_scaled.safetensors?download=true)
se pueda leer y cargar normalmente - Asegúrate de usar el modelo 480P y que se pueda leer normalmente. Si no lo has descargado, haz clic aquí para descargarlo, uno de los siguientes dependiendo del rendimiento de tu dispositivo:
- wan2.1_i2v_480p_14B_bf16.safetensors
- wan2.1_i2v_480p_14B_fp8_e4m3fn.safetensors
- Asegúrate de que el modelo
[wan_2.1_vae.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/vae/wan_2.1_vae.safetensors?download=true)
se pueda leer y cargar normalmente - Haz clic en el botón
Queue
o usa el atajoCtrl(cmd) + Enter
para ejecutar la generación de video - Observa que el tamaño en el nodo
wanImageToVideo
es 512x512
3. Flujo de trabajo de imagen a video Wan2.1 1.3B 1080P
Haz clic en el botón de abajo para descargar el flujo de trabajo correspondiente, luego arrástralo a la interfaz de ComfyUI o usa el menú Workflows
-> Open(Ctrl+O)
para cargarlo
Consulta los números en la imagen para asegurarte de que los nodos y modelos correspondientes estén cargados correctamente para que el modelo funcione normalmente
- Asegúrate de que el modelo
[umt5_xxl_fp8_e4m3fn_scaled.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/text_encoders/umt5_xxl_fp8_e4m3fn_scaled.safetensors?download=true)
se pueda leer y cargar normalmente - Asegúrate de usar el modelo t2v y que se pueda leer normalmente. Si no lo has descargado, haz clic aquí para descargarlo, uno de los siguientes dependiendo del rendimiento de tu dispositivo:
- wan2.1_t2v_1.3B_bf16.safetensors
- wan2.1_t2v_1.3B_fp16.safetensors
- wan2.1_t2v_14B_bf16.safetensors
- wan2.1_t2v_14B_fp8_e4m3fn.safetensors
- Asegúrate de que el modelo
[wan_2.1_vae.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/vae/wan_2.1_vae.safetensors?download=true)
se pueda leer y cargar normalmente - Haz clic en el botón
Queue
o usa el atajoCtrl(cmd) + Enter
para ejecutar la generación de video
Flujos de trabajo de la versión cuantizada de Wan2.1
Esta versión es proporcionada por Kijai y requiere el uso de complementos. Necesitas instalar los siguientes dos complementos:
Descarga de modelos relacionados con la versión cuantizada de Wan2.1
Todos los modelos relacionados provienen de: Kijai/WanVideo_comfy
Modelos de codificadores de texto
Por favor, selecciona la versión fp8 o bf16 según tu dispositivo, descarga los siguientes archivos y guárdalos en la carpeta ComfyUI/models/text_encoders
La versión fp8 requiere menos rendimiento del dispositivo, mientras que la versión bf16 requiere un rendimiento más alto
Modelos de difusión
Según tu dispositivo y el flujo de trabajo que necesites, descarga el archivo del modelo Transformer correspondiente a la carpeta ComfyUI/models/diffusion_models
- Wan2_1-I2V-14B-480P_fp8_e4m3fn.safetensors
- Wan2_1-I2V-14B-720P_fp8_e4m3fn.safetensors
- Wan2_1-T2V-14B_fp8_e4m3fn.safetensors
- Wan2_1-T2V-1_3B_bf16.safetensors
- Wan2_1-T2V-1_3B_fp8_e4m3fn.safetensors
Explicación de los parámetros de los archivos de modelo correspondientes: 1. Tipo de modelo
- I2V: Image to Video, modelo de imagen a video
- T2V: Text to Video, modelo de texto a video
2. Escala del modelo
- 14B: Versión de 14 mil millones de parámetros, mejor efecto pero requiere hardware más potente
- 1_3B: Versión de 1.3 mil millones de parámetros, requiere menos hardware pero el efecto es relativamente simple
3. Resolución
- 480P: Genera videos con resolución de 512x512
- 720P: Genera videos con resolución de 768x768
4. Formato de precisión
- bf16: Brain Floating Point 16, mayor precisión, requiere GPU más nuevas
- fp8: Floating Point 8, menor precisión, requiere menos hardware
- fp16: Floating Point 16, precisión media, adecuada para la mayoría de las GPU
- e4m3fn: Un tipo de formato de punto flotante de 8 bits, optimizado para cálculos de baja precisión
Modelos VAE
Por favor, selecciona la versión fp8 o bf16 según tu dispositivo, descarga los siguientes archivos y guárdalos en la carpeta ComfyUI/models/vae
Flujos de trabajo de la versión cuantizada de Wan2.1
Flujo de trabajo de texto a video de la versión cuantizada de Wan2.1
Haz clic en el botón de abajo para descargar el flujo de trabajo correspondiente, luego arrástralo a la interfaz de ComfyUI o usa el menú Workflows
-> Open(Ctrl+O)
para cargarlo
Explicación del flujo de trabajo
Consulta los números en la imagen para asegurarte de que los nodos y modelos correspondientes estén cargados correctamente para que el modelo funcione normalmente
- Asegúrate de que el modelo
[umt5-xxl-enc-bf16.safetensors](https://huggingface.co/Kijai/WanVideo_comfy/blob/main/umt5-xxl-enc-bf16.safetensors)
se pueda leer y cargar normalmente - Asegúrate de usar el modelo t2v y que se pueda leer normalmente. Si no lo has descargado, haz clic aquí para descargarlo, uno de los siguientes dependiendo del rendimiento de tu dispositivo:
- Asegúrate de que el modelo
Wan2_1_VAE_xxx.safetensors
se pueda leer y cargar normalmente - Haz clic en el botón
Queue
o usa el atajoCtrl(cmd) + Enter
para ejecutar la generación de video
Flujo de trabajo de imagen a video 480P de la versión cuantizada de Wan2.1
Descarga del modelo CLIP
- open-clip-xlm-roberta-large-vit-huge-14_fp16.safetensors
- open-clip-xlm-roberta-large-vit-huge-14_visual_fp32.safetensors
- open-clip-xlm-roberta-large-vit-huge-14_visual_fp32.safetensors
Descarga del flujo de trabajo
Haz clic en el botón de abajo para descargar el flujo de trabajo correspondiente, luego arrástralo a la interfaz de ComfyUI o usa el menú Workflows
-> Open(Ctrl+O)
para cargarlo
Explicación del flujo de trabajo
Consulta los números en la imagen para asegurarte de que los nodos y modelos correspondientes estén cargados correctamente para que el modelo funcione normalmente
- Asegúrate de que el modelo
umt5-xxl-enc-bf16.safetensors
se pueda leer y cargar normalmente, enlace de descarga: umt5-xxl-enc-bf16.safetensors - Asegúrate de que el modelo
open-clip-xlm-roberta-large-vit-huge-14_fp16.safetensors
se pueda leer y cargar normalmente, enlace de descarga: open-clip-xlm-roberta-large-vit-huge-14_fp16.safetensors - Asegúrate de que el modelo
Wan2_1_VAE_bf16.safetensors
se pueda leer y cargar normalmente, enlace de descarga: Wan2_1_VAE_bf16.safetensors - Sube la imagen que deseas convertir en video
- Asegúrate de que el modelo
Wan2_1-I2V-14B-480P_fp8_e4m3fn.safetensors
se pueda leer y cargar normalmente, enlace de descarga: Wan2_1-I2V-14B-480P_fp8_e4m3fn.safetensors - Ingresa en el cuadro de texto la descripción del video que deseas generar
- Haz clic en el botón
Queue
o usa el atajoCtrl(cmd) + Enter
para ejecutar la generación de video
Flujo de trabajo de video a video de la versión cuantizada de Wan2.1
Descarga del flujo de trabajo
Haz clic en el botón de abajo para descargar el flujo de trabajo correspondiente, luego arrástralo a la interfaz de ComfyUI o usa el menú Workflows
-> Open(Ctrl+O)
para cargarlo
Explicación del flujo de trabajo
Consulta los números en la imagen para asegurarte de que los nodos y modelos correspondientes estén cargados correctamente para que el modelo funcione normalmente
- Asegúrate de que el modelo
umt5-xxl-enc-bf16.safetensors
se pueda leer y cargar normalmente, enlace de descarga: umt5-xxl-enc-bf16.safetensors - Sube el video original que deseas transformar
- Asegúrate de que el modelo
Wan2_1-T2V-1_3B_bf16.safetensors
se pueda leer y cargar normalmente, enlace de descarga: Wan2_1-T2V-1_3B_bf16.safetensors - Ingresa la descripción del video que deseas generar
- Asegúrate de que el modelo
Wan2_1_VAE_bf16.safetensors
se pueda leer y cargar normalmente, enlace de descarga: Wan2_1_VAE_bf16.safetensors - Haz clic en el botón
Queue
o usa el atajoCtrl(cmd) + Enter
para ejecutar la generación de video
Recursos relacionados
- Repositorio GitHub del modelo Wan2.1
- Plataforma de demostración en línea del modelo Wan2.1
- Documentación técnica del modelo Wan2.1
- Comunidad de desarrolladores del modelo Wan2.1
- Wan2.1 modelo ComfyUI Repackaged
- Ejemplos de flujos de trabajo ComfyUI del modelo Wan2.1
- Descarga del modelo Wan2.1 gguf
- Descarga del modelo Wan2.1 versión cuantizada