Tencent открывает исходный код модели HunyuanVideo-I2V для преобразования изображений в видео

HunyuanVideo-I2V - это мультимодальная ИИ-модель с 13 миллиардами параметров, которая конвертирует одиночные изображения в 5-секундные HD видео. Модель поставляется с полными ресурсами для разработчиков, включая предварительно обученные веса, код обучения LoRA и решения для развертывания на нескольких платформах.

Модель теперь доступна для загрузки на Hugging Face.

Демонстрации основных функций

Базовая генерация видео

Ваш браузер не поддерживает тег видео

Показы пользовательских эффектов

--|

Ключевые особенности

Интеллектуальная генерация видео

Генерирует 5-секундные HD видео из одиночных изображений (разрешение 2K)
Три режима контроля:
- Текстовые подсказки: Используйте команды "субъект + действие" (например, "спортсмен ныряет + медленное движение")
- Синхронизация аудио: Поддерживает синхронизацию губ с 10 стилями речи
- Предустановленные шаблоны: Включает 5 стандартных танцевальных рутин

Ресурсы для разработчиков

Полные веса модели (13B параметров) и код обучения
Поддержка тонкой настройки LoRA с 900+ пользовательскими моделями, созданными сообществом
Совместимость с потребительскими GPU (требуется минимум RTX 3090)

Практические применения

Электронная коммерция
Модный бренд использует модель для создания 360° видео демонстрации продуктов, достигая 60% более быстрого производства

Кинопроизводство
Анимационные студии сокращают сроки проекта на 40% через пакетно-генерируемые предварительные просмотры раскадровки через API

Творческий контент
Создания сообщества включают "Трансформацию ханьфу Великой стены" и "Танец виртуального идола" (Посмотреть демонстрацию)

Доступ и поддержка

Онлайн демонстрация: Платформа Hunyuan AI Video
Исходный код: Репозиторий GitHub
Документация: Руководство пользователя
Корпоративный сервис: Интеграция API Tencent Cloud
Руководство по рабочему процессу ComfyUI для модели Hunyuan Text-to-Video