Sulphur 2 : Un modèle de génération vidéo de 9B basé sur LTX 2.3
Sulphur 2 est un fine-tuning communautaire de LTX 2.3 offrant une génération vidéo texte-vers-vidéo et image-vers-vidéo, avec un améliorateur de prompt intégré et un distill LoRA, entraîné sur plus de 125 000 clips sélectionnés.
Aperçu
Publié par SulphurAI le 3 mai 2026, Sulphur 2 est un modèle de génération vidéo communautaire affiné sur plus de 125 000 clips vidéo sélectionnés. Construit sur l’architecture LTX 2.3 de Lightricks (un transformateur de diffusion de 22 milliards de paramètres), il permet la génération de vidéo à partir de texte et à partir d’image.
Le modèle prend en charge tous les formats natifs de LTX 2.3 et est livré avec plusieurs composants complémentaires, notamment un améliorateur de prompt, un distill LoRA pour une inférence plus rapide, et des workflows ComfyUI prêts à l’emploi.
Fonctionnalités clés
| Fonctionnalité | Description | |
-|
-| | Architecture | Affiné à partir de Lightricks LTX 2.3 (22B DiT) | | Tâches supportées | Texte vers vidéo (T2V) et image vers vidéo (I2V) | | Taille du modèle | ~9 milliards de paramètres effectifs (dev BF16 : 16,7 Go, FP8 : 8,5 Go) | | Améliorateur de prompt | Améliorateur de prompt au format GGUF intégré disponible | | Distill LoRA | LoRA distillé 1.1 pour une génération plus rapide | | Données d’entraînement | Plus de 125 000 clips vidéo sélectionnés | | Licence | Licence personnalisée non commerciale / recherche |
Variantes du modèle
Sulphur 2 est disponible en plusieurs variantes de poids pour s’adapter à différents matériels :
- sulphur_dev_bf16.safetensors (~16,7 Go) : Version dev en pleine précision
- sulphur_dev_fp8mixed.safetensors (~8,5 Go) : Version dev quantifiée pour moins de VRAM
- sulphur_distil_bf16.safetensors : Version distillée pour une inférence plus rapide
- sulphur_lora_rank_768.safetensors : LoRA pour fine-tuning
- distill_loras/ltx-2.3-22b-distilled-lora-1.1.safetensors : LoRA distillé supplémentaire
Améliorateur de prompt
L’une des fonctionnalités phares de Sulphur 2 est l’inclusion d’un améliorateur de prompt dédié : un petit modèle de langage conditionné au format GGUF qui réécrit et enrichit automatiquement les prompts utilisateur pour de meilleurs résultats de génération vidéo. Deux variantes sont disponibles :
- Améliorateur de prompt standard : Réécriture de prompts à usage général
- Améliorateur de prompt alternatif : Une variante alternative sans filtrage de prompt
L’améliorateur de prompt peut être chargé dans LM Studio ou toute interface d’inférence compatible GGUF.
Intégration ComfyUI
Sulphur 2 est livré avec des workflows ComfyUI prêts à l’emploi, inclus dans le dépôt du modèle :
| Workflow | Description | |
-|
-| | T2V Base | Workflow de base texte vers vidéo | | T2V Distilled | Texte vers vidéo avec distill LoRA | | I2V Base | Workflow de base image vers vidéo | | I2V Distilled | Image vers vidéo avec distill LoRA |
Téléchargez simplement les poids du modèle depuis Hugging Face et placez-les dans votre répertoire ComfyUI/models/diffusion_models/, puis chargez l’un de ces workflows et sélectionnez le checkpoint Sulphur 2.
Performances et qualité
Sulphur 2 a été entraîné sur un jeu de données soigneusement sélectionné de plus de 125 000 clips vidéo, centré sur le contenu visuel humain et diversifié. Il gère :
- Le mouvement humain et l’interaction avec une meilleure cohérence
- Une meilleure adhérence au prompt par rapport au LTX 2.3 de base pour certains cas d’usage créatifs
- La génération native de portraits et de contenu centré sur les personnages
Disponibilité
- Hugging Face : SulphurAI/Sulphur-2-base
- CivitAI : Sulphur 2 Base
- Démo en ligne : sulphur2ai.com
- Discord : Rejoindre la communauté
Résumé
Sulphur 2 représente l’un des fine-tunings communautaires les plus populaires de LTX 2.3, offrant aux créateurs une alternative pour la génération vidéo, avec des outils utiles comme l’amélioration de prompt et l’inférence distillée. Sa combinaison de qualité, de flexibilité et de workflows ComfyUI prêts à l’emploi en fait une option séduisante pour les passionnés de génération vidéo.