Sulphur 2: LTX 2.3ベースの9Bビデオ生成モデル

news

Sulphur 2はLTX 2.3のコミュニティファインチューンであり、内蔵のプロンプトエンハンサーと蒸留LoRAを備えたテキストから動画への生成および画像から動画への生成を提供。125K以上の厳選されたクリップでトレーニングされています。

Sulphur 2は、LightricksのLTX 2.3からファインチューンされた、コミュニティ構築のオープンウェイトビデオ生成モデルです。Hugging Faceで1,800以上のいいねと80万以上のダウンロードを獲得し、オープンソースのビデオ生成分野で最も人気のあるLTX 2.3派生モデルの一つとなっています。

概要

SulphurAIが2026年5月3日にリリースしたSulphur 2は、125K以上の厳選されたビデオクリップでファインチューンされたコミュニティビデオ生成モデルです。LightricksのLTX 2.3アーキテクチャ(22Bパラメータの拡散トランスフォーマー)をベースに、テキストから動画へおよび画像から動画への生成を提供します。

このモデルはすべてのLTX 2.3ネイティブフォーマットをサポートし、プロンプトエンハンサー、より高速な推論のための蒸留LoRA、すぐに使えるComfyUIワークフローなどのいくつかの付属コンポーネントが含まれています。

主な機能

| 機能 | 説明 | |

|

-| | アーキテクチャ | Lightricks LTX 2.3(22B DiT)からファインチューン | | タスクサポート | テキストから動画(T2V)および画像から動画(I2V) | | モデルサイズ | 実効約9Bパラメータ(dev BF16: 16.7 GB、FP8: 8.5 GB) | | プロンプトエンハンサー | バンドルされたGGUFプロンプトエンハンサー(利用可能) | | 蒸留LoRA | 高速生成のための1.1蒸留LoRA | | トレーニングデータ | 125K以上の厳選されたビデオクリップ | | ライセンス | カスタム非商用/研究用 |

モデルバリアント

Sulphur 2には、さまざまなハードウェアに対応するために複数のウェイトバリアントが同梱されています。

  • sulphur_dev_bf16.safetensors(約16.7 GB): フル精度のdevバージョン
  • sulphur_dev_fp8mixed.safetensors(約8.5 GB): 低VRAM向け量子化devバージョン
  • sulphur_distil_bf16.safetensors: 高速推論向け蒸留バージョン
  • sulphur_lora_rank_768.safetensors: ファインチューニング用LoRA
  • distill_loras/ltx-2.3-22b-distilled-lora-1.1.safetensors: 追加の蒸留LoRA

プロンプトエンハンサー

Sulphur 2の際立った機能の1つは、専用のプロンプトエンハンサーが含まれていることです。これはGGUFとしてパッケージ化された小型言語モデルで、ユーザーのプロンプトを自動的に書き換え、強化してより良いビデオ生成結果を得られるようにします。2つのバリアントが用意されています。

  1. スタンダードプロンプトエンハンサー: 一般用途のプロンプト書き換え
  2. Altプロンプトエンハンサー: プロンプトフィルタリングなしの代替バリアント

プロンプトエンハンサーはLM StudioやGGUF互換の推論UIで読み込むことができます。

ComfyUIとの統合

Sulphur 2にはすぐに使えるComfyUIワークフローがモデルリポジトリに含まれています。

| ワークフロー | 説明 | |

|

-| | T2V Base | テキストから動画ベースワークフロー | | T2V Distilled | 蒸留LoRA使用のテキストから動画 | | I2V Base | 画像から動画ベースワークフロー | | I2V Distilled | 蒸留LoRA使用の画像から動画 |

Hugging FaceからモデルウェイトをダウンロードしてComfyUI/models/diffusion_models/ディレクトリに配置し、これらのワークフローのいずれかを読み込んで、Sulphur 2チェックポイントを選択するだけです。

パフォーマンスと品質

Sulphur 2は、人間中心で多様なビジュアルコンテンツに焦点を当てた125K以上のビデオクリップの慎重に厳選されたデータセットでトレーニングされました。以下の機能を扱います。

  • 人間の動きとインタラクションをより一貫性をもって処理
  • 特定のクリエイティブユースケースにおいてベースのLTX 2.3よりも優れたプロンプト追従性
  • ネイティブなポートレートとキャラクター中心の生成

入手方法

Sulphur 2はカスタム非商用/研究用ライセンスのもとでリリースされています。商用アプリケーションでモデルを使用する前に、ライセンス利用規約を確認してください。

まとめ

Sulphur 2は、LTX 2.3の最も人気のあるコミュニティファインチューンの一つであり、プロンプト拡張や蒸留推論などの有用なツールを備えた、クリエイター向けのビデオ生成の代替手段を提供します。品質、柔軟性、すぐに使えるComfyUIワークフローの組み合わせにより、ビデオ生成の愛好家にとって魅力的な選択肢となっています。

Sulphur 2: LTX 2.3ベースの9Bビデオ生成モデル | ComfyUI Wiki