Skip to content
Conviértete en Patrocinador Ayuda a Construir una Mejor Base de Conocimientos de ComfyUI
Serie de TutorialesTutorial Avanzado de ComfyUIFlujo de trabajo Wan2.1 ComfyUI - Guía completa

Flujo de trabajo Wan2.1 ComfyUI

Wan2.1, lanzado como código abierto por Alibaba en febrero de 2025, es un modelo de referencia en el campo de la generación de videos, con licencia Apache 2.0. Ofrece dos versiones: 14B (14 mil millones de parámetros) y 1.3B (1.3 mil millones de parámetros), cubriendo tareas como texto a video (T2V), imagen a video (I2V) y más. Este modelo no solo supera a los modelos de código abierto existentes en rendimiento, sino que su versión ligera requiere solo 8GB de VRAM, reduciendo significativamente la barrera de entrada.

Actualmente, todos los modelos están disponibles para descargar en las plataformas Hugging Face y ModelScope:

Este artículo te guiará a través de los flujos de trabajo relacionados con Wan2.1, incluyendo:

  • Instalación de los modelos Wan2.1
  • Flujo de trabajo de imagen a video con Wan2.1
  • Configuración del flujo de trabajo de texto a video con Wan2.1

Además, la comunidad ha creado versiones GGUF y cuantizadas:

Ejemplos oficiales de flujos de trabajo Wan2.1 ComfyUI

Los siguientes flujos de trabajo provienen del blog oficial de ComfyUI, ya que ComfyUI ahora soporta nativamente Wan2.1

1. Instalación relacionada con Wan2.1

  1. Actualiza ComfyUI a la última versión

Asegúrate de actualizar tu versión de ComfyUI a la más reciente, consulta la guía Cómo actualizar ComfyUI para completar la actualización.

  1. Instalación de modelos de difusión

Diffusion models

Descarga una versión del modelo desde el repositorio reempaquetado de Comfy según el tipo de flujo de trabajo que necesites:

  • i2v es para image to video (imagen a video), t2v es para text to video (texto a video)
  • 14B y 1.3B representan la cantidad de parámetros; cuanto mayor sea el número, mayores serán los requisitos de hardware
  • bf16, fp16, fp8 representan diferentes precisiones; mayor precisión significa mayores requisitos de hardware, siendo fp8 la precisión más baja con menores requisitos pero resultados relativamente inferiores
  • Generalmente, cuanto mayor sea el tamaño del archivo, mayores serán los requisitos de hardware

Guarda los modelos descargados en el directorio ComfyUI/models/diffusion_models

  1. Instalación de modelos de codificadores de texto

Haz clic para descargar umt5_xxl_fp8_e4m3fn_scaled.safetensors

Si la descarga no responde, visita este enlace para descargar

Guarda el modelo descargado en el directorio ComfyUI/models/text_encoders

  1. Instalación de modelos clip_vision

Haz clic para descargar clip_vision_h.safetensors

Si la descarga no responde, visita este enlace para descargar

Guarda el modelo descargado en el directorio ComfyUI/models/clip_vision

  1. Instalación del modelo VAE de Wan2.1

Haz clic para descargar wan_2.1_vae.safetensors

Si la descarga no responde, visita este enlace para descargar

Guarda el modelo descargado en el directorio ComfyUI/models/vae

2. Flujo de trabajo de imagen a video con Wan2.1

Los siguientes dos flujos de trabajo tienen nodos básicos similares, con diferencias en el modelo de difusión utilizado y las dimensiones de video correspondientes. Puedes usar cualquiera de los archivos de flujo de trabajo proporcionados a continuación, o usar uno y modificar los parámetros según mis instrucciones.

2.1 Flujo de trabajo de imagen a video Wan2.1 14B 720P

Descarga del archivo de flujo de trabajo Haz clic en el botón de abajo para descargar el flujo de trabajo correspondiente, luego arrástralo a la interfaz de ComfyUI o usa el menú Workflows -> Open(Ctrl+O) para cargarlo

Ejemplo de imagen de entrada Descarga esta imagen para usarla como entrada Ejemplo de imagen de entrada para el flujo de trabajo de imagen a video Wan2.1 14B 720P

Explicación del flujo de trabajo de imagen a video Wan2.1 720P Flujo de trabajo de imagen a video Wan2.1 14B 720P

Consulta los números en la imagen para asegurarte de que los nodos y modelos correspondientes estén cargados correctamente para que el modelo funcione normalmente

  1. Sube el ejemplo de imagen de entrada proporcionado anteriormente
  2. Asegúrate de que el modelo [clip_vision_h.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/clip_vision/clip_vision_h.safetensors?download=true) se pueda leer y cargar normalmente
  3. Asegúrate de que el modelo [umt5_xxl_fp8_e4m3fn_scaled.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/text_encoders/umt5_xxl_fp8_e4m3fn_scaled.safetensors?download=true) se pueda leer y cargar normalmente
  4. Asegúrate de usar el modelo 720P y que se pueda leer normalmente. Si no lo has descargado, haz clic aquí para descargarlo, uno de los siguientes dependiendo del rendimiento de tu dispositivo:
    • wan2.1_i2v_720p_14B_bf16.safetensors
    • wan2.1_i2v_720p_14B_fp8_e4m3fn.safetensors
  5. Asegúrate de que el modelo [wan_2.1_vae.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/vae/wan_2.1_vae.safetensors?download=true) se pueda leer y cargar normalmente
  6. Haz clic en el botón Queue o usa el atajo Ctrl(cmd) + Enter para ejecutar la generación de video
  7. Observa que el tamaño en el nodo wanImageToVideo es 768x768

2.2 Flujo de trabajo de imagen a video Wan2.1 14B 480P

El flujo de trabajo 480P es similar al de 720P, con la principal diferencia en el nodo LoadDiffusion Model que carga el modelo 480P, y el nodo wanImageToVideo con un tamaño de 512x512

Descarga del archivo de flujo de trabajo Haz clic en el botón de abajo para descargar el flujo de trabajo correspondiente, luego arrástralo a la interfaz de ComfyUI o usa el menú Workflows -> Open(Ctrl+O) para cargarlo

Ejemplo de imagen de entrada Descarga la siguiente imagen para usarla como entrada flux_dev_example

Explicación del flujo de trabajo de imagen a video Wan2.1 480P Flujo de trabajo de imagen a video Wan2.1 14B 480P

Explicación del flujo de trabajo de imagen a video Wan2.1 480P Flujo de trabajo de imagen a video Wan2.1 14B 480P

Consulta los números en la imagen para asegurarte de que los nodos y modelos correspondientes estén cargados correctamente para que el modelo funcione normalmente

  1. Sube el ejemplo de imagen de entrada proporcionado anteriormente
  2. Asegúrate de que el modelo [clip_vision_h.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/clip_vision/clip_vision_h.safetensors?download=true) se pueda leer y cargar normalmente
  3. Asegúrate de que el modelo [umt5_xxl_fp8_e4m3fn_scaled.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/text_encoders/umt5_xxl_fp8_e4m3fn_scaled.safetensors?download=true) se pueda leer y cargar normalmente
  4. Asegúrate de usar el modelo 480P y que se pueda leer normalmente. Si no lo has descargado, haz clic aquí para descargarlo, uno de los siguientes dependiendo del rendimiento de tu dispositivo:
    • wan2.1_i2v_480p_14B_bf16.safetensors
    • wan2.1_i2v_480p_14B_fp8_e4m3fn.safetensors
  5. Asegúrate de que el modelo [wan_2.1_vae.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/vae/wan_2.1_vae.safetensors?download=true) se pueda leer y cargar normalmente
  6. Haz clic en el botón Queue o usa el atajo Ctrl(cmd) + Enter para ejecutar la generación de video
  7. Observa que el tamaño en el nodo wanImageToVideo es 512x512

3. Flujo de trabajo de imagen a video Wan2.1 1.3B 1080P

Haz clic en el botón de abajo para descargar el flujo de trabajo correspondiente, luego arrástralo a la interfaz de ComfyUI o usa el menú Workflows -> Open(Ctrl+O) para cargarlo

Flujo de trabajo de imagen a video Wan2.1 1.3B 1080P

Consulta los números en la imagen para asegurarte de que los nodos y modelos correspondientes estén cargados correctamente para que el modelo funcione normalmente

  1. Asegúrate de que el modelo [umt5_xxl_fp8_e4m3fn_scaled.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/text_encoders/umt5_xxl_fp8_e4m3fn_scaled.safetensors?download=true) se pueda leer y cargar normalmente
  2. Asegúrate de usar el modelo t2v y que se pueda leer normalmente. Si no lo has descargado, haz clic aquí para descargarlo, uno de los siguientes dependiendo del rendimiento de tu dispositivo:
    • wan2.1_t2v_1.3B_bf16.safetensors
    • wan2.1_t2v_1.3B_fp16.safetensors
    • wan2.1_t2v_14B_bf16.safetensors
    • wan2.1_t2v_14B_fp8_e4m3fn.safetensors
  3. Asegúrate de que el modelo [wan_2.1_vae.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/vae/wan_2.1_vae.safetensors?download=true) se pueda leer y cargar normalmente
  4. Haz clic en el botón Queue o usa el atajo Ctrl(cmd) + Enter para ejecutar la generación de video

Flujos de trabajo de la versión cuantizada de Wan2.1

Esta versión es proporcionada por Kijai y requiere el uso de complementos. Necesitas instalar los siguientes dos complementos:

Descarga de modelos relacionados con la versión cuantizada de Wan2.1

Todos los modelos relacionados provienen de: Kijai/WanVideo_comfy

Modelos de codificadores de texto

Por favor, selecciona la versión fp8 o bf16 según tu dispositivo, descarga los siguientes archivos y guárdalos en la carpeta ComfyUI/models/text_encoders

La versión fp8 requiere menos rendimiento del dispositivo, mientras que la versión bf16 requiere un rendimiento más alto

Modelos de difusión

Según tu dispositivo y el flujo de trabajo que necesites, descarga el archivo del modelo Transformer correspondiente a la carpeta ComfyUI/models/diffusion_models

Explicación de los parámetros de los archivos de modelo correspondientes: 1. Tipo de modelo

  • I2V: Image to Video, modelo de imagen a video
  • T2V: Text to Video, modelo de texto a video

2. Escala del modelo

  • 14B: Versión de 14 mil millones de parámetros, mejor efecto pero requiere hardware más potente
  • 1_3B: Versión de 1.3 mil millones de parámetros, requiere menos hardware pero el efecto es relativamente simple

3. Resolución

  • 480P: Genera videos con resolución de 512x512
  • 720P: Genera videos con resolución de 768x768

4. Formato de precisión

  • bf16: Brain Floating Point 16, mayor precisión, requiere GPU más nuevas
  • fp8: Floating Point 8, menor precisión, requiere menos hardware
  • fp16: Floating Point 16, precisión media, adecuada para la mayoría de las GPU
  • e4m3fn: Un tipo de formato de punto flotante de 8 bits, optimizado para cálculos de baja precisión

Modelos VAE

Por favor, selecciona la versión fp8 o bf16 según tu dispositivo, descarga los siguientes archivos y guárdalos en la carpeta ComfyUI/models/vae

Flujos de trabajo de la versión cuantizada de Wan2.1

Flujo de trabajo de texto a video de la versión cuantizada de Wan2.1

Haz clic en el botón de abajo para descargar el flujo de trabajo correspondiente, luego arrástralo a la interfaz de ComfyUI o usa el menú Workflows -> Open(Ctrl+O) para cargarlo

Explicación del flujo de trabajo Flujo de trabajo de texto a video de la versión cuantizada de Wan2.1

Consulta los números en la imagen para asegurarte de que los nodos y modelos correspondientes estén cargados correctamente para que el modelo funcione normalmente

  1. Asegúrate de que el modelo [umt5-xxl-enc-bf16.safetensors](https://huggingface.co/Kijai/WanVideo_comfy/blob/main/umt5-xxl-enc-bf16.safetensors) se pueda leer y cargar normalmente
  2. Asegúrate de usar el modelo t2v y que se pueda leer normalmente. Si no lo has descargado, haz clic aquí para descargarlo, uno de los siguientes dependiendo del rendimiento de tu dispositivo:
  3. Asegúrate de que el modelo Wan2_1_VAE_xxx.safetensors se pueda leer y cargar normalmente
  4. Haz clic en el botón Queue o usa el atajo Ctrl(cmd) + Enter para ejecutar la generación de video

Flujo de trabajo de imagen a video 480P de la versión cuantizada de Wan2.1

Descarga del modelo CLIP

Descarga del flujo de trabajo Haz clic en el botón de abajo para descargar el flujo de trabajo correspondiente, luego arrástralo a la interfaz de ComfyUI o usa el menú Workflows -> Open(Ctrl+O) para cargarlo

Explicación del flujo de trabajo Explicación del flujo de trabajo de imagen a video 480P de la versión cuantizada de Wan2.1

Consulta los números en la imagen para asegurarte de que los nodos y modelos correspondientes estén cargados correctamente para que el modelo funcione normalmente

  1. Asegúrate de que el modelo umt5-xxl-enc-bf16.safetensors se pueda leer y cargar normalmente, enlace de descarga: umt5-xxl-enc-bf16.safetensors
  2. Asegúrate de que el modelo open-clip-xlm-roberta-large-vit-huge-14_fp16.safetensors se pueda leer y cargar normalmente, enlace de descarga: open-clip-xlm-roberta-large-vit-huge-14_fp16.safetensors
  3. Asegúrate de que el modelo Wan2_1_VAE_bf16.safetensors se pueda leer y cargar normalmente, enlace de descarga: Wan2_1_VAE_bf16.safetensors
  4. Sube la imagen que deseas convertir en video
  5. Asegúrate de que el modelo Wan2_1-I2V-14B-480P_fp8_e4m3fn.safetensors se pueda leer y cargar normalmente, enlace de descarga: Wan2_1-I2V-14B-480P_fp8_e4m3fn.safetensors
  6. Ingresa en el cuadro de texto la descripción del video que deseas generar
  7. Haz clic en el botón Queue o usa el atajo Ctrl(cmd) + Enter para ejecutar la generación de video

Flujo de trabajo de video a video de la versión cuantizada de Wan2.1

Descarga del flujo de trabajo Haz clic en el botón de abajo para descargar el flujo de trabajo correspondiente, luego arrástralo a la interfaz de ComfyUI o usa el menú Workflows -> Open(Ctrl+O) para cargarlo

Explicación del flujo de trabajo Flujo de trabajo de video a video de la versión cuantizada de Wan2.1

Consulta los números en la imagen para asegurarte de que los nodos y modelos correspondientes estén cargados correctamente para que el modelo funcione normalmente

  1. Asegúrate de que el modelo umt5-xxl-enc-bf16.safetensors se pueda leer y cargar normalmente, enlace de descarga: umt5-xxl-enc-bf16.safetensors
  2. Sube el video original que deseas transformar
  3. Asegúrate de que el modelo Wan2_1-T2V-1_3B_bf16.safetensors se pueda leer y cargar normalmente, enlace de descarga: Wan2_1-T2V-1_3B_bf16.safetensors
  4. Ingresa la descripción del video que deseas generar
  5. Asegúrate de que el modelo Wan2_1_VAE_bf16.safetensors se pueda leer y cargar normalmente, enlace de descarga: Wan2_1_VAE_bf16.safetensors
  6. Haz clic en el botón Queue o usa el atajo Ctrl(cmd) + Enter para ejecutar la generación de video

Recursos relacionados