Sulphur 2: модель генерации видео на 9B параметров на основе LTX 2.3

news

Sulphur 2 — это созданная сообществом доработка LTX 2.3, предлагающая генерацию видео из текста и изображения со встроенным улучшателем промптов и дистиллированной LoRA, обученная на 125K+ отобранных клипов.

Sulphur 2 — это созданная сообществом модель генерации видео с открытыми весами, доработанная на базе Lightricks LTX 2.3. Имея более 1800 лайков и 800K+ загрузок на Hugging Face, она быстро стала одним из самых популярных производных LTX 2.3 в области генерации видео с открытым исходным кодом.

Обзор

Выпущенная SulphurAI 3 мая 2026 года, Sulphur 2 — это модель генерации видео, доработанная на 125K+ отобранных видеоклипах. Построенная на архитектуре Lightricks LTX 2.3 (диффузионный трансформер с 22 миллиардами параметров), она обеспечивает генерацию как из текста в видео, так и из изображения в видео.

Модель поддерживает все родные форматы LTX 2.3 и поставляется с несколькими сопутствующими компонентами, включая улучшатель промптов, дистиллированную LoRA для более быстрого вывода и готовые к использованию рабочие процессы ComfyUI.

Ключевые особенности

| Особенность | Описание | |

|

-| | Архитектура | Доработана на базе Lightricks LTX 2.3 (22B DiT) | | Поддержка задач | Генерация из текста в видео (T2V) и из изображения в видео (I2V) | | Размер модели | ~9B эффективных параметров (dev BF16: 16.7 ГБ, FP8: 8.5 ГБ) | | Улучшатель промптов | Встроенный улучшатель промптов в формате GGUF | | Дистиллированная LoRA | Дистиллированная LoRA 1.1 для более быстрой генерации | | Обучающие данные | 125K+ отобранных видеоклипов | | Лицензия | Пользовательская некоммерческая / исследовательская |

Варианты модели

Sulphur 2 поставляется с несколькими вариантами весов для разных конфигураций оборудования:

  • sulphur_dev_bf16.safetensors (~16.7 ГБ): полная точность, версия для разработки
  • sulphur_dev_fp8mixed.safetensors (~8.5 ГБ): квантованная версия для разработки, для меньшего объёма VRAM
  • sulphur_distil_bf16.safetensors: дистиллированная версия для более быстрого вывода
  • sulphur_lora_rank_768.safetensors: LoRA для дообучения
  • distill_loras/ltx-2.3-22b-distilled-lora-1.1.safetensors: дополнительная дистиллированная LoRA

Улучшатель промптов

Одной из выдающихся особенностей Sulphur 2 является включение специализированного улучшателя промптов: небольшая языковая модель, упакованная в формат GGUF, которая автоматически переписывает и обогащает пользовательские промпты для улучшения результатов генерации видео. Доступны два варианта:

  1. Стандартный улучшатель промптов: универсальное переписывание промптов
  2. Альтернативный улучшатель промптов: вариант без фильтрации промптов

Улучшатель промптов можно загрузить в LM Studio или любой интерфейс вывода, совместимый с GGUF.

Интеграция с ComfyUI

Sulphur 2 поставляется с готовыми к использованию рабочими процессами ComfyUI, включёнными в репозиторий модели:

| Рабочий процесс | Описание | |

|

-| | T2V Base | Базовый рабочий процесс текст-в-видео | | T2V Distilled | Текст-в-видео с дистиллированной LoRA | | I2V Base | Базовый рабочий процесс изображение-в-видео | | I2V Distilled | Изображение-в-видео с дистиллированной LoRA |

Просто загрузите веса модели с Hugging Face и поместите их в каталог ComfyUI/models/diffusion_models/, затем загрузите один из этих рабочих процессов и выберите чекпоинт Sulphur 2.

Производительность и качество

Sulphur 2 был обучен на тщательно отобранном наборе данных из 125K+ видеоклипов, ориентированных на человеко-центричный и разнообразный визуальный контент. Он обрабатывает:

  • Движения человека и взаимодействие с улучшенной согласованностью
  • Улучшенное соответствие промпту по сравнению с базовой LTX 2.3 для некоторых творческих случаев использования
  • Родную генерацию портретов и фокус на персонажах

Доступность

Sulphur 2 выпускается под пользовательской некоммерческой / исследовательской лицензией. Перед использованием модели в коммерческих целях ознакомьтесь с условиями лицензии.

Резюме

Sulphur 2 представляет собой одну из самых популярных доработок LTX 2.3, созданных сообществом, предлагая создателям альтернативу для генерации видео с полезными инструментами, такими как улучшение промптов и дистиллированный вывод. Сочетание качества, гибкости и готовых к использованию рабочих процессов ComfyUI делает его привлекательным вариантом для энтузиастов генерации видео.

Sulphur 2: модель генерации видео на 9B параметров на основе LTX 2.3 | ComfyUI Wiki