Skip to content
ComfyUI Wiki
より良い ComfyUI ナレッジベースの構築を支援する サポーターになる

Wan2.2 Fun InP ComfyUI ワークフロー完全使用ガイド、公式+コミュニティ版(Kijai、GGUF)

チュートリアル概要

このチュートリアルでは、ComfyUIにおけるWan2.2 Fun InP先頭末尾フレームビデオ生成モデルの様々な実装方法と使用方法を全面的に紹介します。Wan2.2 Fun InPはアリババクラウドが発表したプロフェッショナルな先頭末尾フレーム制御ビデオ生成モデルで、先頭フレームと末尾フレーム画像の入力をサポートし、中間遷移ビデオを生成することで、クリエイターにより強いクリエイティブ制御力を提供します。

本チュートリアルがカバーするバージョンと内容

完成済みバージョン:

  • ComfyUI 公式ネイティブ版 - ComfyOrg公式が提供する完全ワークフロー
  • Wan2.2 Fun InP 14B 先頭末尾フレーム版 - 高品質な先頭末尾フレーム制御ビデオ生成

準備中のバージョン:

  • 🔄 Kijai WanVideoWrapper 版 - コミュニティ開発の便利なラッパー
  • 🔄 GGUF 量子化版 - 低スペックデバイス向けの最適化版

モデル技術特徴

Wan2.2 Fun InPはWan2.2アーキテクチャをベースに、先頭末尾フレーム制御ビデオ生成のために特別に最適化されており、以下の核心的特徴を備えています:

核心的優位性:

  • 先頭末尾フレーム制御:先頭フレームと末尾フレーム画像の入力をサポートし、中間遷移ビデオを生成することで、ビデオの一貫性とクリエイティブ自由度を向上
  • 高品質ビデオ生成:Wan2.2アーキテクチャをベースに、映画レベル品質のビデオを出力
  • マルチ解像度サポート:512×512、768×768、1024×1024など解像度のビデオ生成をサポートし、異なるシナリオ要求に適応

Wan2.2 Fun InPシリーズモデルはApache2.0オープンソースライセンスをベースに、商業利用をサポートします。Apache2.0ライセンスでは、商用利用を含め、これらのモデルを自由に使用、変更、配布できます。元の著作権表示とライセンステキストを保持するだけでOKです。

Wan2.2 Fun InP オープンソースモデルバージョン概要

モデルタイプモデル名パラメータ数主要機能モデルリポジトリ
先頭末尾フレーム制御Wan2.2-Fun-A14B-InP14B先頭フレームと末尾フレーム画像の入力をサポートし、中間遷移ビデオを生成することで、クリエイターにより強いクリエイティブ制御力を提供🤗 Wan2.2-Fun-A14B-InP
ビデオ制御Wan2.2-Fun-A14B-Control14BCanny、Depth、Pose、MLSDなど異なる制御条件をサポートし、軌跡制御もサポート🤗 Wan2.2-Fun-A14B-Control

公式学習リソース

関連コードリポジトリ

Loading...

Wan2.2 Fun InP ComfyUI 公式ネイティブ版ワークフロー使用ガイド

バージョン説明

ComfyUI公式ネイティブ版はComfyOrgチームが提供し、再パッケージされたモデルファイルを使用してComfyUIとの最適な互換性を確保します。このバージョンは標準モードとLightx2v 4ステップLoRA加速モードの両方をサポートします。

パフォーマンス比較テスト

以下はRTX4090D 24GB VRAM GPUを使用した640*640解像度、81フレーム長さのテスト結果です:

モデルタイプ解像度VRAM使用量初回生成時間2回目生成時間
fp8_scaled640×64083%≈ 524秒≈ 520秒
fp8_scaled + 4ステップLoRA加速640×64089%≈ 138秒≈ 79秒

加速LoRAを使用することで顕著な速度向上が得られますが、ダイナミクスに若干の損失があります。低VRAMユーザーにはよりユーザーフレンドリーです。そのため、提供される2つのワークフローの中で、加速LoRAバージョンがデフォルトで有効になっています。別のワークフローを有効にする必要がある場合、選択後Ctrl+Bを使用してください。

1. Wan2.2 Fun InP 先頭末尾フレームビデオ生成 ComfyUI ワークフロー

ワークフロー取得方法

以下の素材を先頭末尾フレームとして使用

Wan2.2 Fun Control ComfyUI ワークフロー開始フレーム素材 Wan2.2 Fun Control ComfyUI ワークフロー開始フレーム素材

モデルファイルダウンロード

拡散モデル

Lightning LoRA(任意、加速用)

VAE

テキストエンコーダー

ComfyUI/
├───📂 models/
│   ├───📂 diffusion_models/
│   │   ├─── wan2.2_fun_inpaint_high_noise_14B_fp8_scaled.safetensors
│   │   └─── wan2.2_fun_inpaint_low_noise_14B_fp8_scaled.safetensors
│   ├───📂 loras/
│   │   ├─── wan2.2_i2v_lightx2v_4steps_lora_v1_high_noise.safetensors
│   │   └─── wan2.2_i2v_lightx2v_4steps_lora_v1_low_noise.safetensors
│   ├───📂 text_encoders/
│   │   └─── umt5_xxl_fp8_e4m3fn_scaled.safetensors 
│   └───📂 vae/
│       └── wan_2.1_vae.safetensors

操作手順詳細

手順図

💡

このワークフローはLoRAを使用しています。対応する拡散モデルとLoRAが一致していることを確認してください

  1. High noise モデル及び LoRA ロード
  • Load Diffusion Modelノードがwan2.2_fun_inpaint_high_noise_14B_fp8_scaled.safetensorsモデルをロードしていることを確認
  • LoraLoaderModelOnlyノードがwan2.2_i2v_lightx2v_4steps_lora_v1_high_noise.safetensorsをロードしていることを確認
  1. Low noise モデル及び LoRA ロード
  • Load Diffusion Modelノードがwan2.2_fun_inpaint_low_noise_14B_fp8_scaled.safetensorsモデルをロードしていることを確認
  • LoraLoaderModelOnlyノードがwan2.2_i2v_lightx2v_4steps_lora_v1_low_noise.safetensorsをロードしていることを確認
  1. Load CLIPノードがumt5_xxl_fp8_e4m3fn_scaled.safetensorsモデルをロードしていることを確認
  2. Load VAEノードがwan_2.1_vae.safetensorsモデルをロードしていることを確認
  3. 先頭末尾フレーム画像アップロード、それぞれ先頭末尾フレーム画像素材をアップロード
  4. Promptグループでプロンプトを入力
  5. WanFunInpaintToVideoノードのサイズとビデオ長さ調整
    • widthheightの寸法を調整、デフォルトは640、小さなサイズを設定しているので必要に応じて変更可能
    • lengthを調整、これはビデオ総フレーム数です。現在のワークフローfpsは16です。5秒のビデオを生成する場合、5*16 = 80を設定すべきです
  6. Runボタンをクリック、またはショートカットCtrl(cmd) + Enterでビデオ生成を実行

Wan2.2 Fun InP Kijai WanVideoWrapper ComfyUI ワークフロー

⚠️

この内容は準備中で、近日中に更新予定です。

このチュートリアルの一部では、Kijai/ComfyUI-WanVideoWrapperの便利な方法を紹介します。

関連モデルリポジトリ:https://huggingface.co/Kijai/WanVideo_comfy_fp8_scaled

Wan2.2 Fun InP GGUF 量子化版 ComfyUI ワークフロー

⚠️

この内容は準備中で、近日中に更新予定です。

GGUF版はVRAMが限られたユーザー向けで、以下のリソースを提供:

QuantStack/Wan2.2-Fun-A14B-InP-GGUF

関連カスタムノード: City96/ComfyUI-GGUF