Выпуск открытой версии WAN2.2 и нативная поддержка ComfyUI с первого дня

ComfyUI Wan2.2 Open Source Version Support Release

Команда WAN официально представила открытую версию модели Wan2.2! Это новая мультимодальная модель генерации видео, использующая инновационную архитектуру MoE (Mixture of Experts), что позволяет значительно повысить качество создаваемых видеороликов. Модель полностью открыта по лицензии Apache 2.0 и разрешена для коммерческого использования.

ComfyUI первой реализовала нативную поддержку Wan2.2! Теперь вы можете напрямую опробовать возможности генерации видео, которые предоставляет Wan2.2, в интерфейсе ComfyUI. Модель включает экспертные подмодели для работы с высоким и низким уровнем шума, что позволяет разделять задачи по этапам шумоподавления и получать более качественный видеоконтент.

Я подготовил официальный туториал по нативной версии в официальной документации ComfyUI. Руководство по WanVideoWrapper будет обновлено в ближайшее время.

Особенности модели Wan2.2

Архитектура экспертных моделей MoE: Подмодели с высоким уровнем шума отвечают за общий макет, с низким — за детализацию
Кинематографический контроль эстетики: Профессиональный подход к композиции, поддержка многомерного визуального управления (освещение, цвет, композиция)
Сложные движения в большом масштабе: Плавное восстановление сложных движений, улучшение управляемости и естественности анимации
Точное следование смыслу: Понимание сложных сцен, генерация нескольких объектов, лучшее соответствие творческому замыслу
Эффективная технология сжатия: Существенное обновление данных по сравнению с версией 2.1, высокая степень сжатия VAE в версии 5B, оптимизация использования памяти

Технические достижения Wan2.2

Инновационный дизайн архитектуры MoE
Wan2.2 — первая модель, успешно применившая архитектуру MoE в диффузионных моделях генерации видео. В версии 27B используются экспертные подмодели для разных этапов шумоподавления: на этапе высокого шума формируется общий макет видео, на этапе низкого — прорабатываются детали. Такое разделение задач позволяет повысить качество итогового видео.

Существенное расширение обучающих данных
В сравнении с Wan2.1, в Wan2.2 значительно увеличен объем обучающих данных: изображений стало больше на 65,6%, видео — на 83,2%. Это расширение не только улучшает обобщающую способность модели, но и повышает разнообразие создаваемого контента, что особенно заметно в сложных сценах, эстетике и генерации движений.

Эстетическая донастройка и обучение с подкреплением
В Wan2.2 добавлен специальный этап эстетической донастройки, учитывающий стандарты киноиндустрии по освещению, композиции и цветовой психологии. Благодаря технологии обучения с подкреплением (RL) модель лучше соответствует человеческим эстетическим предпочтениям, а создаваемые видео ближе к профессиональным стандартам.

Версии модели Wan2.2

Оригинальные версии

Wan2.2-TI2V-5B: Генерация видео по тексту/изображению
https://huggingface.co/Wan-AI/Wan2.2-TI2V-5B
Wan2.2-I2V-A14B: Преобразование изображений в видео
https://huggingface.co/Wan-AI/Wan2.2-I2V-A14B
Wan2.2-T2V-A14B: Генерация высококачественного видео по тексту
https://huggingface.co/Wan-AI/Wan2.2-T2V-A14B

Переупакованная версия для ComfyUI

https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged

📚 Доступные версии

Wan2.2-TI2V-5B: FP16
Wan2.2-I2V-14B: FP16/FP8
Wan2.2-T2V-14B: FP16/FP8

Поддержка Wan2.2 в ComfyUI

ComfyUI, как одна из ведущих платформ для создания AI-изображений с помощью workflow (рабочих процессов), реализовала полную нативную поддержку Wan2.2. Пользователи могут напрямую использовать различные функции Wan2.2 в ComfyUI, включая:

Генерация видео по тексту: Создание видеороликов на основе текстовых описаний
Преобразование изображений в видео: Превращение статичных изображений в динамичный видеоконтент
Смешанный режим: Поддержка одновременного ввода текста и изображений

Благодаря node-based (узловой) структуре workflow в ComfyUI, использование Wan2.2 становится более гибким и удобным — можно легко комбинировать параметры и настройки для достижения оптимального результата.

Обновление веб-платформы Tongyi Wanxiang

Помимо открытой модели, веб-платформа Tongyi Wanxiang также получила ряд обновлений:

Обновление творческих функций

Wanxiang Box: Единая точка входа для создания изображений и видео
Aggregated View: Новый режим агрегированного просмотра, позволяющий объединять задачи с одинаковым вводом и редактировать их последовательно

Функции управления проектами

Управление активами по проектам: Организация видеопроектов по отдельным единицам
Таймлайн-редактирование: Возможность редактирования и расстановки активов на временной шкале
Редактирование и обработка видео: Поддержка локального редактирования, перерисовки, расширения и других операций