ComfyUIがサブグラフ機能を正式リリース
2025/08/07
Wan2.2 Fun Control ComfyUI ワークフロー完全使用ガイド、公式+コミュニティ版(Kijai、GGUF)
このチュートリアルでは、ComfyUIにおけるWan2.2 Fun Controlビデオ制御生成モデルの様々な実装方法と使用方法を全面的に紹介します。Wan2.2 Fun Controlはアリババクラウドが発表した次世代ビデオ生成・制御モデルで、革新的な制御コード(Control Codes)メカニズムを導入し、ディープラーニングとマルチモーダル条件入力と組み合わせることで、事前に設定された制御条件に合致する高品質なビデオを生成できます。
本チュートリアルがカバーするバージョンと内容
完成済みバージョン:
- ✅ ComfyUI 公式ネイティブ版 - ComfyOrg公式ドキュメントで提供される完全ワークフロー
- ✅ Wan2.2 Fun Control 14B ビデオ制御版 - 高品質マルチモーダル制御ビデオ生成
準備中のバージョン:
- 🔄 Kijai WanVideoWrapper 版 - コミュニティ開発の便利なラッパー
- 🔄 GGUF 量子化版 - 低スペックデバイス向けの最適化版
モデル技術特徴
Wan2.2 Fun ControlはWan2.2アーキテクチャをベースに、ビデオ制御生成のために特別に最適化されており、以下の核心的特徴を備えています:
核心的優位性:
- マルチモーダル制御:Canny(線画)、Depth(深度)、OpenPose(人体ポーズ)、MLSD(幾何エッジ)など複数の制御条件をサポートし、軌跡制御もサポート
- 高品質ビデオ生成:Wan2.2アーキテクチャをベースに、映画レベル品質のビデオを出力
- 多言語サポート:中国語、英語など多言語プロンプト入力をサポート
- マルチ解像度サポート:512×512、768×768、1024×1024など解像度のビデオ生成をサポートし、異なるシナリオ要求に適応
オープンソースライセンス説明
Wan2.2 Fun ControlシリーズモデルはApache2.0オープンソースライセンスをベースに、商業利用をサポートします。Apache2.0ライセンスでは、商用利用を含め、これらのモデルを自由に使用、変更、配布できます。元の著作権表示とライセンステキストを保持するだけでOKです。
Wan2.2 Fun Control オープンソースモデルバージョン概要
モデルタイプ | モデル名 | パラメータ数 | 主要機能 | モデルリポジトリ |
---|---|---|---|---|
ビデオ制御 | Wan2.2-Fun-A14B-Control | 14B | Canny、Depth、Pose、MLSDなど異なる制御条件をサポートし、軌跡制御もサポート | 🤗 Wan2.2-Fun-A14B-Control |
関連コードリポジトリ
- VideoX-Fun GitHub リポジトリ - 公式提供の完全実装コード
- Wan2.2 Fun Control 公式ドキュメント - 詳細なモデル説明と使用ガイド
Wan2.2 Fun Control ComfyUI 公式ネイティブ版ワークフロー使用ガイド
バージョン説明
ComfyUI公式ネイティブ版はComfyOrgチームが提供し、再パッケージされたモデルファイルを使用してComfyUIとの最適な互換性を確保します。このバージョンは標準モードとLightx2v 4ステップLoRA加速モードの両方をサポートします。
パフォーマンス比較テスト
以下はRTX4090D 24GB VRAM GPUを使用した640*640解像度、81フレーム長さのテスト結果です:
モデルタイプ | 解像度 | VRAM使用量 | 初回生成時間 | 2回目生成時間 |
---|---|---|---|---|
fp8_scaled | 640×640 | 83% | ≈ 524秒 | ≈ 520秒 |
fp8_scaled + 4ステップLoRA加速 | 640×640 | 89% | ≈ 138秒 | ≈ 79秒 |
4ステップLoRAを使用することで、ワークフローを初めて使用するユーザーの体験は向上しますが、ビデオのダイナミクスに損失が生じる可能性があります。デフォルトで加速LoRAバージョンを有効にしています。別のワークフローセットを有効にする必要がある場合、選択後Ctrl+Bを使用してください。
1. Wan2.2 Fun Control ビデオ制御生成 ComfyUI ワークフロー
ワークフロー取得方法
以下のビデオまたはJSONファイルをダウンロードし、ComfyUIにドラッグして対応するワークフローをロードしてください
JSON形式ワークフローをダウンロード
以下の画像及びビデオをダウンロードしてください。入力として使用します。
ここでは前処理済みのビデオを使用し、直接制御ビデオ生成に使用できます
モデルファイルダウンロード
以下のモデルはWan_2.2_ComfyUI_Repackagedで見つけることができます
拡散モデル
- wan2.2_fun_control_high_noise_14B_fp8_scaled.safetensors
- wan2.2_fun_control_low_noise_14B_fp8_scaled.safetensors
Wan2.2-Lightning LoRA(任意、加速用)
- wan2.2_i2v_lightx2v_4steps_lora_v1_high_noise.safetensors
- wan2.2_i2v_lightx2v_4steps_lora_v1_low_noise.safetensors
VAE
テキストエンコーダー
ComfyUI/
├───📂 models/
│ ├───📂 diffusion_models/
│ │ ├─── wan2.2_fun_control_low_noise_14B_fp8_scaled.safetensors
│ │ └─── wan2.2_fun_control_high_noise_14B_fp8_scaled.safetensors
│ ├───📂 loras/
│ │ ├─── wan2.2_i2v_lightx2v_4steps_lora_v1_high_noise.safetensors
│ │ └─── wan2.2_i2v_lightx2v_4steps_lora_v1_low_noise.safetensors
│ ├───📂 text_encoders/
│ │ └─── umt5_xxl_fp8_e4m3fn_scaled.safetensors
│ └───📂 vae/
│ └── wan_2.1_vae.safetensors
操作手順詳細
このワークフローはLoRAを使用しています。対応する拡散モデルとLoRAが一致していることを確認してください。high noiseとlow noiseのモデルとLoRAは対応して使用する必要があります。
- High noise モデル及び LoRA ロード
Load Diffusion Model
ノードがwan2.2_fun_control_high_noise_14B_fp8_scaled.safetensors
モデルをロードしていることを確認LoraLoaderModelOnly
ノードがwan2.2_i2v_lightx2v_4steps_lora_v1_high_noise.safetensors
をロードしていることを確認
- Low noise モデル及び LoRA ロード
Load Diffusion Model
ノードがwan2.2_fun_control_low_noise_14B_fp8_scaled.safetensors
モデルをロードしていることを確認LoraLoaderModelOnly
ノードがwan2.2_i2v_lightx2v_4steps_lora_v1_low_noise.safetensors
をロードしていることを確認
Load CLIP
ノードがumt5_xxl_fp8_e4m3fn_scaled.safetensors
モデルをロードしていることを確認Load VAE
ノードがwan_2.1_vae.safetensors
モデルをロードしていることを確認Load Image
ノードで開始フレームをアップロード- 2番目の
Load video
ノードでポーズビデオを制御。提供されるビデオは前処理済みで直接使用可能 - 提供するビデオは前処理済みポーズビデオのため、対応するビデオ画像前処理ノードを無効化する必要があります。選択後Ctrl + B`で無効化できます
- Promptを変更 - 中国語と英語の両方がサポート
Wan22FunControlToVideo
で対応するビデオサイズを変更。デフォルトでは低VRAMユーザーがこのワークフローを使用する際の時間消費を避けるため、640*640の解像度に設定Run
ボタンをクリック、またはショートカットCtrl(cmd) + Enter
でビデオ生成を実行
補足説明
ComfyUIのビルトインノードでは、前処理ノードにCanny前処理のみがあるため、ComfyUI-comfyui_controlnet_auxのようなものを使用して他のタイプの画像前処理を実装できます
Wan2.2 Fun Control Kijai WanVideoWrapper ComfyUI ワークフロー
この内容は準備中で、近日中に更新予定です。
このチュートリアルの一部では、Kijai/ComfyUI-WanVideoWrapperの便利な方法を紹介します。
関連モデルリポジトリ:https://huggingface.co/Kijai/WanVideo_comfy_fp8_scaled
Wan2.2 Fun Control GGUF 量子化版 ComfyUI ワークフロー
この内容は準備中で、近日中に更新予定です。
GGUF版はVRAMが限られたユーザー向けで、以下のリソースを提供:
QuantStack/Wan2.2-Fun-A14B-Control-GGUF
関連カスタムノード: City96/ComfyUI-GGUF