Skip to content
ComfyUI Wiki
Ayuda a Construir una Mejor Base de Conocimientos de ComfyUI Conviértete en Patrocinador
NoticiasLanzamiento de la versión open source de WAN2.2 y soporte nativo en ComfyUI desde el primer día

Lanzamiento de la versión open source de WAN2.2 y soporte nativo en ComfyUI desde el primer día

Lanzamiento del soporte de la versión open source de Wan2.2 en ComfyUI

¡El equipo de WAN ha lanzado oficialmente la versión open source de Wan2.2! Se trata de un nuevo modelo multimodal para generación de video que utiliza una arquitectura MoE (Mixture of Experts), lo que mejora la calidad de los videos generados. El modelo es completamente open source bajo la licencia Apache 2.0 y permite su uso comercial.

ComfyUI ya ofrece soporte nativo para Wan2.2 desde el primer momento. Ahora puedes experimentar directamente la tecnología de generación de video de Wan2.2 en ComfyUI. El modelo está compuesto por expertos de alto y bajo nivel de ruido, que se activan según las etapas del proceso de reducción de ruido, generando así videos de mayor calidad.

He completado el tutorial oficial de la versión nativa en la documentación oficial de ComfyUI. El tutorial de WanVideoWrapper será actualizado próximamente.

Características del modelo Wan2.2

  • Arquitectura MoE (Mixture of Experts): Los expertos de alto ruido gestionan la estructura general, mientras que los de bajo ruido refinan los detalles.
  • Control estético cinematográfico: Soporta control visual en varios aspectos como iluminación, color y composición.
  • Movimiento complejo a gran escala: Permite reproducir movimientos complejos de forma fluida y natural.
  • Adherencia semántica precisa: Mejor comprensión de escenas complejas y generación de múltiples objetos, restaurando mejor la intención creativa.
  • Tecnología de compresión eficiente: Mejora significativa de datos respecto a la versión 2.1, con compresión VAE de alta relación en la versión 5B, optimizando el uso de memoria.

Avances técnicos de Wan2.2

Diseño innovador de arquitectura MoE
Wan2.2 es el primer modelo que aplica con éxito la arquitectura MoE en modelos de difusión para generación de video. La versión 27B utiliza expertos de alto y bajo ruido, que se activan según las etapas del proceso de reducción de ruido. La etapa de alto ruido se centra en la estructura general del video, mientras que la de bajo ruido refina los detalles, mejorando así la calidad del resultado.

Ampliación significativa de datos de entrenamiento
En comparación con Wan2.1, Wan2.2 ha ampliado notablemente sus datos de entrenamiento: los datos de imagen aumentaron un 65,6% y los de video un 83,2%. Esta expansión mejora la capacidad de generalización y la diversidad creativa del modelo, permitiendo mejores resultados en escenas complejas, expresión estética y generación de movimiento.

Ajuste estético y aprendizaje por refuerzo
Wan2.2 incorpora una etapa específica de ajuste estético, integrando estándares de la industria cinematográfica en iluminación, composición y psicología del color. Además, utiliza aprendizaje por refuerzo (RL) para afinar aún más el modelo, alineando los resultados con las preferencias estéticas humanas y logrando videos más coherentes con los estándares profesionales.

Versiones del modelo Wan2.2

Versiones originales

Versión adaptada para ComfyUI

https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged

📚 Versiones disponibles

Wan2.2-TI2V-5B: FP16
Wan2.2-I2V-14B: FP16/FP8
Wan2.2-T2V-14B: FP16/FP8

Soporte de ComfyUI para Wan2.2

ComfyUI, como una de las principales plataformas de workflow para generación de imágenes con IA, ya ofrece soporte nativo completo para Wan2.2. Los usuarios pueden utilizar directamente varias funciones de Wan2.2 en ComfyUI, incluyendo:

  • Generación de video a partir de texto: Crear videos de alta calidad usando descripciones sencillas.
  • Conversión de imagen a video: Transformar imágenes estáticas en contenido de video dinámico.
  • Modo mixto: Soporte para entrada combinada de texto e imagen.

El diseño basado en nodos de ComfyUI hace que el uso de Wan2.2 sea más flexible y eficiente, permitiendo combinar diferentes parámetros y configuraciones para obtener los mejores resultados.

Actualización de la plataforma web Tongyi Wanxiang

Además del modelo open source, la plataforma web Tongyi Wanxiang también ha recibido mejoras importantes:

Renovación de funciones creativas

  • Wanxiang Box: Punto de entrada unificado para la creación de imágenes y videos.
  • Vista agregada: Nueva función que permite mostrar tareas agrupadas por entrada y edición continua.

Función de colección de proyectos

  • Gestión de activos por proyecto: Organización de la creación de videos por proyectos.
  • Edición en línea de tiempo: Permite editar y organizar los activos en una línea de tiempo.
  • Edición y procesamiento de video: Soporta edición local, redibujado, extensión y otras operaciones.

Enlaces relacionados