Skip to content
ComfyUI Wiki
Помогите создать лучшую базу знаний ComfyUI Стать спонсором
НовостиTencent открывает исходный код модели HunyuanVideo-I2V для преобразования изображений в видео

Tencent Hunyuan запускает модель генерации видео с открытым исходным кодом

HunyuanVideo-I2V - это мультимодальная ИИ-модель с 13 миллиардами параметров, которая конвертирует одиночные изображения в 5-секундные HD видео. Модель поставляется с полными ресурсами для разработчиков, включая предварительно обученные веса, код обучения LoRA и решения для развертывания на нескольких платформах.

Диаграмма архитектуры модели

Модель теперь доступна для загрузки на Hugging Face.

Демонстрации основных функций

Базовая генерация видео

Показы пользовательских эффектов

Тип эффектаРеференсное изображениеСгенерированный результат
Рост волосReference
Движение объятийReference

Ключевые особенности

Интеллектуальная генерация видео

  • Генерирует 5-секундные HD видео из одиночных изображений (разрешение 2K)
  • Три режима контроля:
    • Текстовые подсказки: Используйте команды “субъект + действие” (например, “спортсмен ныряет + медленное движение”)
    • Синхронизация аудио: Поддерживает синхронизацию губ с 10 стилями речи
    • Предустановленные шаблоны: Включает 5 стандартных танцевальных рутин

Ресурсы для разработчиков

  • Полные веса модели (13B параметров) и код обучения
  • Поддержка тонкой настройки LoRA с 900+ пользовательскими моделями, созданными сообществом
  • Совместимость с потребительскими GPU (требуется минимум RTX 3090)

Практические применения

Электронная коммерция
Модный бренд использует модель для создания 360° видео демонстрации продуктов, достигая 60% более быстрого производства

Кинопроизводство
Анимационные студии сокращают сроки проекта на 40% через пакетно-генерируемые предварительные просмотры раскадровки через API

Творческий контент
Создания сообщества включают “Трансформацию ханьфу Великой стены” и “Танец виртуального идола” (Посмотреть демонстрацию)

Доступ и поддержка