Sulphur 2: модель генерации видео на 9B параметров на основе LTX 2.3
Sulphur 2 — это созданная сообществом доработка LTX 2.3, предлагающая генерацию видео из текста и изображения со встроенным улучшателем промптов и дистиллированной LoRA, обученная на 125K+ отобранных клипов.
Обзор
Выпущенная SulphurAI 3 мая 2026 года, Sulphur 2 — это модель генерации видео, доработанная на 125K+ отобранных видеоклипах. Построенная на архитектуре Lightricks LTX 2.3 (диффузионный трансформер с 22 миллиардами параметров), она обеспечивает генерацию как из текста в видео, так и из изображения в видео.
Модель поддерживает все родные форматы LTX 2.3 и поставляется с несколькими сопутствующими компонентами, включая улучшатель промптов, дистиллированную LoRA для более быстрого вывода и готовые к использованию рабочие процессы ComfyUI.
Ключевые особенности
| Особенность | Описание | |
|
-| | Архитектура | Доработана на базе Lightricks LTX 2.3 (22B DiT) | | Поддержка задач | Генерация из текста в видео (T2V) и из изображения в видео (I2V) | | Размер модели | ~9B эффективных параметров (dev BF16: 16.7 ГБ, FP8: 8.5 ГБ) | | Улучшатель промптов | Встроенный улучшатель промптов в формате GGUF | | Дистиллированная LoRA | Дистиллированная LoRA 1.1 для более быстрой генерации | | Обучающие данные | 125K+ отобранных видеоклипов | | Лицензия | Пользовательская некоммерческая / исследовательская |
Варианты модели
Sulphur 2 поставляется с несколькими вариантами весов для разных конфигураций оборудования:
- sulphur_dev_bf16.safetensors (~16.7 ГБ): полная точность, версия для разработки
- sulphur_dev_fp8mixed.safetensors (~8.5 ГБ): квантованная версия для разработки, для меньшего объёма VRAM
- sulphur_distil_bf16.safetensors: дистиллированная версия для более быстрого вывода
- sulphur_lora_rank_768.safetensors: LoRA для дообучения
- distill_loras/ltx-2.3-22b-distilled-lora-1.1.safetensors: дополнительная дистиллированная LoRA
Улучшатель промптов
Одной из выдающихся особенностей Sulphur 2 является включение специализированного улучшателя промптов: небольшая языковая модель, упакованная в формат GGUF, которая автоматически переписывает и обогащает пользовательские промпты для улучшения результатов генерации видео. Доступны два варианта:
- Стандартный улучшатель промптов: универсальное переписывание промптов
- Альтернативный улучшатель промптов: вариант без фильтрации промптов
Улучшатель промптов можно загрузить в LM Studio или любой интерфейс вывода, совместимый с GGUF.
Интеграция с ComfyUI
Sulphur 2 поставляется с готовыми к использованию рабочими процессами ComfyUI, включёнными в репозиторий модели:
| Рабочий процесс | Описание | |
|
-| | T2V Base | Базовый рабочий процесс текст-в-видео | | T2V Distilled | Текст-в-видео с дистиллированной LoRA | | I2V Base | Базовый рабочий процесс изображение-в-видео | | I2V Distilled | Изображение-в-видео с дистиллированной LoRA |
Просто загрузите веса модели с Hugging Face и поместите их в каталог ComfyUI/models/diffusion_models/, затем загрузите один из этих рабочих процессов и выберите чекпоинт Sulphur 2.
Производительность и качество
Sulphur 2 был обучен на тщательно отобранном наборе данных из 125K+ видеоклипов, ориентированных на человеко-центричный и разнообразный визуальный контент. Он обрабатывает:
- Движения человека и взаимодействие с улучшенной согласованностью
- Улучшенное соответствие промпту по сравнению с базовой LTX 2.3 для некоторых творческих случаев использования
- Родную генерацию портретов и фокус на персонажах
Доступность
- Hugging Face: SulphurAI/Sulphur-2-base
- CivitAI: Sulphur 2 Base
- Демо в браузере: sulphur2ai.com
- Discord: Присоединиться к сообществу
Резюме
Sulphur 2 представляет собой одну из самых популярных доработок LTX 2.3, созданных сообществом, предлагая создателям альтернативу для генерации видео с полезными инструментами, такими как улучшение промптов и дистиллированный вывод. Сочетание качества, гибкости и готовых к использованию рабочих процессов ComfyUI делает его привлекательным вариантом для энтузиастов генерации видео.