Tencent publica modelo open source HunyuanVideo-I2V para generar videos a partir de imágenes

news

El equipo Hunyuan de Tencent lanza modelo open source que genera videos de 5 segundos desde una sola imagen, con funciones inteligentes de generación de movimientos y efectos personalizados

HunyuanVideo-I2V es una herramienta de conversión de imagen a video desarrollada con un modelo multimodal de 13 mil millones de parámetros. Permite generar videos HD de 5 segundos a partir de una sola imagen, incluyendo un kit completo para desarrolladores con pesos preentrenados, código de entrenamiento LoRA y soluciones de implementación multiplataforma.

Diagrama de la arquitectura del modelo

El modelo está disponible para descarga en Hugging Face.

Demostración de funciones principales

Ejemplo básico de generación de video

Su navegador no soporta la etiqueta de video

Casos de efectos personalizados

| Tipo de efecto | Imagen de referencia | Resultado generado | |

|

-|

-| | Crecimiento de cabello | Imagen de referencia | | | Movimiento de abrazo | Imagen de referencia | |

Características principales

Generación inteligente de video

  • Crea videos HD de 5 segundos desde una sola imagen (resolución 2K)
  • Tres modos de control:
    • Descripción textual: Usando comandos "sujeto + acción" (ej. "atleta saltando + cámara lenta")
    • Sincronización de audio: Compatible con 10 estilos de voz para sincronización labial
    • Plantillas predefinidas: Incluye 5 rutinas de baile estándar

Soporte para desarrolladores

  • Proporciona pesos completos del modelo (13B parámetros) y código de entrenamiento
  • Tecnología de ajuste fino LoRA, con más de 900 modelos personalizados creados por la comunidad
  • Compatible con tarjetas gráficas de consumo (mínimo RTX 3090 requerido)

Casos de uso reales

Comercio electrónico
Una marca de moda utiliza el modelo para crear videos de 360° de productos, aumentando la eficiencia de producción en un 60%

Producción cinematográfica
Estudios de animación reducen tiempos de proyecto en 40% mediante generación masiva de previsualizaciones

Contenido creativo
La comunidad ha creado obras como "Transformación Hanfu en la Gran Muralla" y "Baile de Ídolo Virtual" (Ver ejemplos)

Acceso y soporte

Tencent publica modelo open source HunyuanVideo-I2V para generar videos a partir de imágenes | ComfyUI Wiki