Sulphur 2: Un modelo de generación de video de 9B basado en LTX 2.3
Sulphur 2 es un ajuste fino comunitario de LTX 2.3 que ofrece generación de video de texto a video y de imagen a video, con un mejorador de prompts integrado y un LoRA destilado, entrenado en más de 125K clips seleccionados.
Panorama general
Publicado por SulphurAI el 3 de mayo de 2026, Sulphur 2 es un modelo de generación de video ajustado en más de 125K clips de video seleccionados. Construido sobre la arquitectura LTX 2.3 de Lightricks (un transformer de difusión de 22B parámetros), proporciona generación de video tanto de texto a video como de imagen a video.
El modelo es compatible con todos los formatos nativos de LTX 2.3 y viene con varios componentes complementarios, incluyendo un mejorador de prompts, un LoRA destilado para inferencia más rápida y flujos de trabajo listos para usar en ComfyUI.
Características principales
| Característica | Descripción | |
-|
-| | Arquitectura | Ajuste fino de Lightricks LTX 2.3 (DiT de 22B) | | Soporte de tareas | Texto a Video (T2V) e Imagen a Video (I2V) | | Tamaño del modelo | ~9B parámetros efectivos (dev BF16: 16.7 GB, FP8: 8.5 GB) | | Mejorador de prompts | Mejorador de prompts GGUF incluido | | LoRA destilado | LoRA destilado 1.1 para generación más rápida | | Datos de entrenamiento | Más de 125K clips de video seleccionados | | Licencia | Personalizada no comercial / investigación |
Variantes del modelo
Sulphur 2 se distribuye con varias variantes de pesos para adaptarse a diferentes hardware:
- sulphur_dev_bf16.safetensors (~16.7 GB): Versión de desarrollo de precisión completa
- sulphur_dev_fp8mixed.safetensors (~8.5 GB): Versión de desarrollo cuantizada para menor VRAM
- sulphur_distil_bf16.safetensors: Versión destilada para inferencia más rápida
- sulphur_lora_rank_768.safetensors: LoRA para ajuste fino
- distill_loras/ltx-2.3-22b-distilled-lora-1.1.safetensors: LoRA destilado adicional
Mejorador de prompts
Una de las características destacadas de Sulphur 2 es la inclusión de un mejorador de prompts dedicado: un pequeño modelo de lenguaje empaquetado como GGUF que reescribe y enriquece automáticamente los prompts del usuario para obtener mejores resultados de generación de video. Hay dos variantes disponibles:
- Mejorador de prompts estándar: Reescritura de prompts de propósito general
- Mejorador de prompts alternativo: Una variante alternativa sin filtrado de prompts
El mejorador de prompts se puede cargar en LM Studio o en cualquier interfaz de inferencia compatible con GGUF.
Integración con ComfyUI
Sulphur 2 incluye flujos de trabajo listos para usar en ComfyUI incluidos en el repositorio del modelo:
| Flujo de trabajo | Descripción | |
|
-| | T2V Base | Flujo de trabajo base de texto a video | | T2V Destilado | Texto a video con LoRA destilado | | I2V Base | Flujo de trabajo base de imagen a video | | I2V Destilado | Imagen a video con LoRA destilado |
Simplemente descargue los pesos del modelo desde Hugging Face y colóquelos en su directorio ComfyUI/models/diffusion_models/, luego cargue uno de estos flujos de trabajo y seleccione el checkpoint de Sulphur 2.
Rendimiento y calidad
Sulphur 2 fue entrenado en un conjunto de datos cuidadosamente seleccionado de más de 125K clips de video centrados en contenido visual diverso y centrado en humanos. Maneja:
- Movimiento humano e interacción con consistencia mejorada
- Mejor adherencia a los prompts en comparación con el LTX 2.3 base para ciertos casos de uso creativos
- Generación nativa enfocada en retratos y personajes
Disponibilidad
- Hugging Face: SulphurAI/Sulphur-2-base
- CivitAI: Sulphur 2 Base
- Demo en navegador: sulphur2ai.com
- Discord: Unirse a la comunidad
Resumen
Sulphur 2 representa uno de los ajustes finos comunitarios más populares de LTX 2.3, ofreciendo a los creadores una alternativa para la generación de video con herramientas útiles como mejora de prompts e inferencia destilada. Su combinación de calidad, flexibilidad y flujos de trabajo listos para usar en ComfyUI lo convierte en una opción atractiva para los entusiastas de la generación de video.