ByteDanceがSa2VAをリリース:初の統合型画像・動画理解モデル
2025/10/17
Wan2.2 Fun InP ComfyUI ワークフロー完全使用ガイド、公式+コミュニティ版(Kijai、GGUF)
チュートリアル概要
このチュートリアルでは、ComfyUIにおけるWan2.2 Fun InP先頭末尾フレームビデオ生成モデルの様々な実装方法と使用方法を全面的に紹介します。Wan2.2 Fun InPはアリババクラウドが発表したプロフェッショナルな先頭末尾フレーム制御ビデオ生成モデルで、先頭フレームと末尾フレーム画像の入力をサポートし、中間遷移ビデオを生成することで、クリエイターにより強いクリエイティブ制御力を提供します。
本チュートリアルがカバーするバージョンと内容
完成済みバージョン:
- ✅ ComfyUI 公式ネイティブ版 - ComfyOrg公式が提供する完全ワークフロー
 - ✅ Wan2.2 Fun InP 14B 先頭末尾フレーム版 - 高品質な先頭末尾フレーム制御ビデオ生成
 
準備中のバージョン:
- 🔄 Kijai WanVideoWrapper 版 - コミュニティ開発の便利なラッパー
 - 🔄 GGUF 量子化版 - 低スペックデバイス向けの最適化版
 
モデル技術特徴
Wan2.2 Fun InPはWan2.2アーキテクチャをベースに、先頭末尾フレーム制御ビデオ生成のために特別に最適化されており、以下の核心的特徴を備えています:
核心的優位性:
- 先頭末尾フレーム制御:先頭フレームと末尾フレーム画像の入力をサポートし、中間遷移ビデオを生成することで、ビデオの一貫性とクリエイティブ自由度を向上
 - 高品質ビデオ生成:Wan2.2アーキテクチャをベースに、映画レベル品質のビデオを出力
 - マルチ解像度サポート:512×512、768×768、1024×1024など解像度のビデオ生成をサポートし、異なるシナリオ要求に適応
 
Wan2.2 Fun InPシリーズモデルはApache2.0オープンソースライセンスをベースに、商業利用をサポートします。Apache2.0ライセンスでは、商用利用を含め、これらのモデルを自由に使用、変更、配布できます。元の著作権表示とライセンステキストを保持するだけでOKです。
Wan2.2 Fun InP オープンソースモデルバージョン概要
| モデルタイプ | モデル名 | パラメータ数 | 主要機能 | モデルリポジトリ | 
|---|---|---|---|---|
| 先頭末尾フレーム制御 | Wan2.2-Fun-A14B-InP | 14B | 先頭フレームと末尾フレーム画像の入力をサポートし、中間遷移ビデオを生成することで、クリエイターにより強いクリエイティブ制御力を提供 | 🤗 Wan2.2-Fun-A14B-InP | 
| ビデオ制御 | Wan2.2-Fun-A14B-Control | 14B | Canny、Depth、Pose、MLSDなど異なる制御条件をサポートし、軌跡制御もサポート | 🤗 Wan2.2-Fun-A14B-Control | 
公式学習リソース
関連コードリポジトリ
- VideoX-Fun GitHub リポジトリ - 公式提供の完全実装コード
 - Wan2.2 Fun 公式ドキュメント - 詳細なモデル説明と使用ガイド
 
Wan2.2 Fun InP ComfyUI 公式ネイティブ版ワークフロー使用ガイド
バージョン説明
ComfyUI公式ネイティブ版はComfyOrgチームが提供し、再パッケージされたモデルファイルを使用してComfyUIとの最適な互換性を確保します。このバージョンは標準モードとLightx2v 4ステップLoRA加速モードの両方をサポートします。
パフォーマンス比較テスト
以下はRTX4090D 24GB VRAM GPUを使用した640*640解像度、81フレーム長さのテスト結果です:
| モデルタイプ | 解像度 | VRAM使用量 | 初回生成時間 | 2回目生成時間 | 
|---|---|---|---|---|
| fp8_scaled | 640×640 | 83% | ≈ 524秒 | ≈ 520秒 | 
| fp8_scaled + 4ステップLoRA加速 | 640×640 | 89% | ≈ 138秒 | ≈ 79秒 | 
加速LoRAを使用することで顕著な速度向上が得られますが、ダイナミクスに若干の損失があります。低VRAMユーザーにはよりユーザーフレンドリーです。そのため、提供される2つのワークフローの中で、加速LoRAバージョンがデフォルトで有効になっています。別のワークフローを有効にする必要がある場合、選択後Ctrl+Bを使用してください。
1. Wan2.2 Fun InP 先頭末尾フレームビデオ生成 ComfyUI ワークフロー
ワークフロー取得方法
以下の素材を先頭末尾フレームとして使用

モデルファイルダウンロード
拡散モデル
- wan2.2_fun_inpaint_high_noise_14B_fp8_scaled.safetensors
 - wan2.2_fun_inpaint_low_noise_14B_fp8_scaled.safetensors
 
Lightning LoRA(任意、加速用)
- wan2.2_i2v_lightx2v_4steps_lora_v1_high_noise.safetensors
 - wan2.2_i2v_lightx2v_4steps_lora_v1_low_noise.safetensors
 
VAE
テキストエンコーダー
ComfyUI/
├───📂 models/
│   ├───📂 diffusion_models/
│   │   ├─── wan2.2_fun_inpaint_high_noise_14B_fp8_scaled.safetensors
│   │   └─── wan2.2_fun_inpaint_low_noise_14B_fp8_scaled.safetensors
│   ├───📂 loras/
│   │   ├─── wan2.2_i2v_lightx2v_4steps_lora_v1_high_noise.safetensors
│   │   └─── wan2.2_i2v_lightx2v_4steps_lora_v1_low_noise.safetensors
│   ├───📂 text_encoders/
│   │   └─── umt5_xxl_fp8_e4m3fn_scaled.safetensors 
│   └───📂 vae/
│       └── wan_2.1_vae.safetensors操作手順詳細

このワークフローはLoRAを使用しています。対応する拡散モデルとLoRAが一致していることを確認してください
- High noise モデル及び LoRA ロード
 
Load Diffusion Modelノードがwan2.2_fun_inpaint_high_noise_14B_fp8_scaled.safetensorsモデルをロードしていることを確認LoraLoaderModelOnlyノードがwan2.2_i2v_lightx2v_4steps_lora_v1_high_noise.safetensorsをロードしていることを確認
- Low noise モデル及び LoRA ロード
 
Load Diffusion Modelノードがwan2.2_fun_inpaint_low_noise_14B_fp8_scaled.safetensorsモデルをロードしていることを確認LoraLoaderModelOnlyノードがwan2.2_i2v_lightx2v_4steps_lora_v1_low_noise.safetensorsをロードしていることを確認
Load CLIPノードがumt5_xxl_fp8_e4m3fn_scaled.safetensorsモデルをロードしていることを確認Load VAEノードがwan_2.1_vae.safetensorsモデルをロードしていることを確認- 先頭末尾フレーム画像アップロード、それぞれ先頭末尾フレーム画像素材をアップロード
 - Promptグループでプロンプトを入力
 WanFunInpaintToVideoノードのサイズとビデオ長さ調整widthとheightの寸法を調整、デフォルトは640、小さなサイズを設定しているので必要に応じて変更可能lengthを調整、これはビデオ総フレーム数です。現在のワークフローfpsは16です。5秒のビデオを生成する場合、5*16 = 80を設定すべきです
Runボタンをクリック、またはショートカットCtrl(cmd) + Enterでビデオ生成を実行
Wan2.2 Fun InP Kijai WanVideoWrapper ComfyUI ワークフロー
この内容は準備中で、近日中に更新予定です。
このチュートリアルの一部では、Kijai/ComfyUI-WanVideoWrapperの便利な方法を紹介します。
関連モデルリポジトリ:https://huggingface.co/Kijai/WanVideo_comfy_fp8_scaled
Wan2.2 Fun InP GGUF 量子化版 ComfyUI ワークフロー
この内容は準備中で、近日中に更新予定です。
GGUF版はVRAMが限られたユーザー向けで、以下のリソースを提供:
QuantStack/Wan2.2-Fun-A14B-InP-GGUF
関連カスタムノード: City96/ComfyUI-GGUF