Skip to content
ComfyUI Wiki
より良い ComfyUI ナレッジベースの構築を支援する サポーターになる

Wan2.2 Fun Control ComfyUI ワークフロー完全使用ガイド、公式+コミュニティ版(Kijai、GGUF)

このチュートリアルでは、ComfyUIにおけるWan2.2 Fun Controlビデオ制御生成モデルの様々な実装方法と使用方法を全面的に紹介します。Wan2.2 Fun Controlはアリババクラウドが発表した次世代ビデオ生成・制御モデルで、革新的な制御コード(Control Codes)メカニズムを導入し、ディープラーニングとマルチモーダル条件入力と組み合わせることで、事前に設定された制御条件に合致する高品質なビデオを生成できます。

本チュートリアルがカバーするバージョンと内容

完成済みバージョン:

  • ComfyUI 公式ネイティブ版 - ComfyOrg公式ドキュメントで提供される完全ワークフロー
  • Wan2.2 Fun Control 14B ビデオ制御版 - 高品質マルチモーダル制御ビデオ生成

準備中のバージョン:

  • 🔄 Kijai WanVideoWrapper 版 - コミュニティ開発の便利なラッパー
  • 🔄 GGUF 量子化版 - 低スペックデバイス向けの最適化版

モデル技術特徴

Wan2.2 Fun ControlはWan2.2アーキテクチャをベースに、ビデオ制御生成のために特別に最適化されており、以下の核心的特徴を備えています:

核心的優位性:

  • マルチモーダル制御:Canny(線画)、Depth(深度)、OpenPose(人体ポーズ)、MLSD(幾何エッジ)など複数の制御条件をサポートし、軌跡制御もサポート
  • 高品質ビデオ生成:Wan2.2アーキテクチャをベースに、映画レベル品質のビデオを出力
  • 多言語サポート:中国語、英語など多言語プロンプト入力をサポート
  • マルチ解像度サポート:512×512、768×768、1024×1024など解像度のビデオ生成をサポートし、異なるシナリオ要求に適応

オープンソースライセンス説明

Wan2.2 Fun ControlシリーズモデルはApache2.0オープンソースライセンスをベースに、商業利用をサポートします。Apache2.0ライセンスでは、商用利用を含め、これらのモデルを自由に使用、変更、配布できます。元の著作権表示とライセンステキストを保持するだけでOKです。

Wan2.2 Fun Control オープンソースモデルバージョン概要

モデルタイプモデル名パラメータ数主要機能モデルリポジトリ
ビデオ制御Wan2.2-Fun-A14B-Control14BCanny、Depth、Pose、MLSDなど異なる制御条件をサポートし、軌跡制御もサポート🤗 Wan2.2-Fun-A14B-Control

関連コードリポジトリ

Loading...

Wan2.2 Fun Control ComfyUI 公式ネイティブ版ワークフロー使用ガイド

バージョン説明

ComfyUI公式ネイティブ版はComfyOrgチームが提供し、再パッケージされたモデルファイルを使用してComfyUIとの最適な互換性を確保します。このバージョンは標準モードとLightx2v 4ステップLoRA加速モードの両方をサポートします。

パフォーマンス比較テスト

以下はRTX4090D 24GB VRAM GPUを使用した640*640解像度、81フレーム長さのテスト結果です:

モデルタイプ解像度VRAM使用量初回生成時間2回目生成時間
fp8_scaled640×64083%≈ 524秒≈ 520秒
fp8_scaled + 4ステップLoRA加速640×64089%≈ 138秒≈ 79秒

4ステップLoRAを使用することで、ワークフローを初めて使用するユーザーの体験は向上しますが、ビデオのダイナミクスに損失が生じる可能性があります。デフォルトで加速LoRAバージョンを有効にしています。別のワークフローセットを有効にする必要がある場合、選択後Ctrl+Bを使用してください。

1. Wan2.2 Fun Control ビデオ制御生成 ComfyUI ワークフロー

ワークフロー取得方法

以下のビデオまたはJSONファイルをダウンロードし、ComfyUIにドラッグして対応するワークフローをロードしてください

JSON形式ワークフローをダウンロード

以下の画像及びビデオをダウンロードしてください。入力として使用します。

入力開始画像

ここでは前処理済みのビデオを使用し、直接制御ビデオ生成に使用できます

モデルファイルダウンロード

以下のモデルはWan_2.2_ComfyUI_Repackagedで見つけることができます

拡散モデル

Wan2.2-Lightning LoRA(任意、加速用)

VAE

テキストエンコーダー

ComfyUI/
├───📂 models/
│   ├───📂 diffusion_models/
│   │   ├─── wan2.2_fun_control_low_noise_14B_fp8_scaled.safetensors
│   │   └─── wan2.2_fun_control_high_noise_14B_fp8_scaled.safetensors
│   ├───📂 loras/
│   │   ├─── wan2.2_i2v_lightx2v_4steps_lora_v1_high_noise.safetensors
│   │   └─── wan2.2_i2v_lightx2v_4steps_lora_v1_low_noise.safetensors
│   ├───📂 text_encoders/
│   │   └─── umt5_xxl_fp8_e4m3fn_scaled.safetensors 
│   └───📂 vae/
│       └── wan_2.1_vae.safetensors

操作手順詳細

Wan2.2 Fun Control ワークフロー手順

💡

このワークフローはLoRAを使用しています。対応する拡散モデルとLoRAが一致していることを確認してください。high noiseとlow noiseのモデルとLoRAは対応して使用する必要があります。

  1. High noise モデル及び LoRA ロード
  • Load Diffusion Modelノードがwan2.2_fun_control_high_noise_14B_fp8_scaled.safetensorsモデルをロードしていることを確認
  • LoraLoaderModelOnlyノードがwan2.2_i2v_lightx2v_4steps_lora_v1_high_noise.safetensorsをロードしていることを確認
  1. Low noise モデル及び LoRA ロード
  • Load Diffusion Modelノードがwan2.2_fun_control_low_noise_14B_fp8_scaled.safetensorsモデルをロードしていることを確認
  • LoraLoaderModelOnlyノードがwan2.2_i2v_lightx2v_4steps_lora_v1_low_noise.safetensorsをロードしていることを確認
  1. Load CLIPノードがumt5_xxl_fp8_e4m3fn_scaled.safetensorsモデルをロードしていることを確認
  2. Load VAEノードがwan_2.1_vae.safetensorsモデルをロードしていることを確認
  3. Load Imageノードで開始フレームをアップロード
  4. 2番目のLoad videoノードでポーズビデオを制御。提供されるビデオは前処理済みで直接使用可能
  5. 提供するビデオは前処理済みポーズビデオのため、対応するビデオ画像前処理ノードを無効化する必要があります。選択後Ctrl + B`で無効化できます
  6. Promptを変更 - 中国語と英語の両方がサポート
  7. Wan22FunControlToVideoで対応するビデオサイズを変更。デフォルトでは低VRAMユーザーがこのワークフローを使用する際の時間消費を避けるため、640*640の解像度に設定
  8. Runボタンをクリック、またはショートカットCtrl(cmd) + Enterでビデオ生成を実行

補足説明

ComfyUIのビルトインノードでは、前処理ノードにCanny前処理のみがあるため、ComfyUI-comfyui_controlnet_auxのようなものを使用して他のタイプの画像前処理を実装できます

Wan2.2 Fun Control Kijai WanVideoWrapper ComfyUI ワークフロー

⚠️

この内容は準備中で、近日中に更新予定です。

このチュートリアルの一部では、Kijai/ComfyUI-WanVideoWrapperの便利な方法を紹介します。

関連モデルリポジトリ:https://huggingface.co/Kijai/WanVideo_comfy_fp8_scaled

Wan2.2 Fun Control GGUF 量子化版 ComfyUI ワークフロー

⚠️

この内容は準備中で、近日中に更新予定です。

GGUF版はVRAMが限られたユーザー向けで、以下のリソースを提供:

QuantStack/Wan2.2-Fun-A14B-Control-GGUF

関連カスタムノード: City96/ComfyUI-GGUF

関連リソース

Wan2.2 Fun 公式リソース

コミュニティリソース