OpenMOSS、MOVA をリリース - オープンソース音声・動画同期生成モデル

2026/01/29

Wan2.2 Fun InP ComfyUI ワークフロー完全使用ガイド、公式+コミュニティ版（Kijai、GGUF）

チュートリアル概要

このチュートリアルでは、ComfyUIにおけるWan2.2 Fun InP先頭末尾フレームビデオ生成モデルの様々な実装方法と使用方法を全面的に紹介します。Wan2.2 Fun InPはアリババクラウドが発表したプロフェッショナルな先頭末尾フレーム制御ビデオ生成モデルで、先頭フレームと末尾フレーム画像の入力をサポートし、中間遷移ビデオを生成することで、クリエイターにより強いクリエイティブ制御力を提供します。

本チュートリアルがカバーするバージョンと内容

完成済みバージョン：

✅ ComfyUI 公式ネイティブ版 - ComfyOrg公式が提供する完全ワークフロー
✅ Wan2.2 Fun InP 14B 先頭末尾フレーム版 - 高品質な先頭末尾フレーム制御ビデオ生成

準備中のバージョン：

🔄 Kijai WanVideoWrapper 版 - コミュニティ開発の便利なラッパー
🔄 GGUF 量子化版 - 低スペックデバイス向けの最適化版

モデル技術特徴

Wan2.2 Fun InPはWan2.2アーキテクチャをベースに、先頭末尾フレーム制御ビデオ生成のために特別に最適化されており、以下の核心的特徴を備えています：

核心的優位性：

先頭末尾フレーム制御：先頭フレームと末尾フレーム画像の入力をサポートし、中間遷移ビデオを生成することで、ビデオの一貫性とクリエイティブ自由度を向上
高品質ビデオ生成：Wan2.2アーキテクチャをベースに、映画レベル品質のビデオを出力
マルチ解像度サポート：512×512、768×768、1024×1024など解像度のビデオ生成をサポートし、異なるシナリオ要求に適応

Wan2.2 Fun InPシリーズモデルはApache2.0オープンソースライセンスをベースに、商業利用をサポートします。Apache2.0ライセンスでは、商用利用を含め、これらのモデルを自由に使用、変更、配布できます。元の著作権表示とライセンステキストを保持するだけでOKです。

Wan2.2 Fun InP オープンソースモデルバージョン概要

モデルタイプ	モデル名	パラメータ数	主要機能	モデルリポジトリ
先頭末尾フレーム制御	Wan2.2-Fun-A14B-InP	14B	先頭フレームと末尾フレーム画像の入力をサポートし、中間遷移ビデオを生成することで、クリエイターにより強いクリエイティブ制御力を提供	🤗 Wan2.2-Fun-A14B-InP
ビデオ制御	Wan2.2-Fun-A14B-Control	14B	Canny、Depth、Pose、MLSDなど異なる制御条件をサポートし、軌跡制御もサポート	🤗 Wan2.2-Fun-A14B-Control

公式学習リソース

Wan2.2 Fun InP ComfyUI 公式ネイティブ版ワークフロー使用ガイド

バージョン説明

ComfyUI公式ネイティブ版はComfyOrgチームが提供し、再パッケージされたモデルファイルを使用してComfyUIとの最適な互換性を確保します。このバージョンは標準モードとLightx2v 4ステップLoRA加速モードの両方をサポートします。

パフォーマンス比較テスト

以下はRTX4090D 24GB VRAM GPUを使用した640*640解像度、81フレーム長さのテスト結果です：

モデルタイプ	解像度	VRAM使用量	初回生成時間	2回目生成時間
fp8_scaled	640×640	83%	≈ 524秒	≈ 520秒
fp8_scaled + 4ステップLoRA加速	640×640	89%	≈ 138秒	≈ 79秒

加速LoRAを使用することで顕著な速度向上が得られますが、ダイナミクスに若干の損失があります。低VRAMユーザーにはよりユーザーフレンドリーです。そのため、提供される2つのワークフローの中で、加速LoRAバージョンがデフォルトで有効になっています。別のワークフローを有効にする必要がある場合、選択後Ctrl+Bを使用してください。

1. Wan2.2 Fun InP 先頭末尾フレームビデオ生成 ComfyUI ワークフロー

ワークフロー取得方法

以下の素材を先頭末尾フレームとして使用

Wan2.2 Fun Control ComfyUI ワークフロー開始フレーム素材

モデルファイルダウンロード

拡散モデル

Lightning LoRA（任意、加速用）

VAE

wan_2.1_vae.safetensors

テキストエンコーダー

umt5_xxl_fp8_e4m3fn_scaled.safetensors

ComfyUI/
├───📂 models/
│   ├───📂 diffusion_models/
│   │   ├─── wan2.2_fun_inpaint_high_noise_14B_fp8_scaled.safetensors
│   │   └─── wan2.2_fun_inpaint_low_noise_14B_fp8_scaled.safetensors
│   ├───📂 loras/
│   │   ├─── wan2.2_i2v_lightx2v_4steps_lora_v1_high_noise.safetensors
│   │   └─── wan2.2_i2v_lightx2v_4steps_lora_v1_low_noise.safetensors
│   ├───📂 text_encoders/
│   │   └─── umt5_xxl_fp8_e4m3fn_scaled.safetensors 
│   └───📂 vae/
│       └── wan_2.1_vae.safetensors

操作手順詳細

手順図

💡

このワークフローはLoRAを使用しています。対応する拡散モデルとLoRAが一致していることを確認してください

High noise モデル及び LoRA ロード

Load Diffusion Modelノードがwan2.2_fun_inpaint_high_noise_14B_fp8_scaled.safetensorsモデルをロードしていることを確認
LoraLoaderModelOnlyノードがwan2.2_i2v_lightx2v_4steps_lora_v1_high_noise.safetensorsをロードしていることを確認

Low noise モデル及び LoRA ロード

Load Diffusion Modelノードがwan2.2_fun_inpaint_low_noise_14B_fp8_scaled.safetensorsモデルをロードしていることを確認
LoraLoaderModelOnlyノードがwan2.2_i2v_lightx2v_4steps_lora_v1_low_noise.safetensorsをロードしていることを確認

Load CLIPノードがumt5_xxl_fp8_e4m3fn_scaled.safetensorsモデルをロードしていることを確認
Load VAEノードがwan_2.1_vae.safetensorsモデルをロードしていることを確認
先頭末尾フレーム画像アップロード、それぞれ先頭末尾フレーム画像素材をアップロード
Promptグループでプロンプトを入力
WanFunInpaintToVideoノードのサイズとビデオ長さ調整
- widthとheightの寸法を調整、デフォルトは640、小さなサイズを設定しているので必要に応じて変更可能
- lengthを調整、これはビデオ総フレーム数です。現在のワークフローfpsは16です。5秒のビデオを生成する場合、5*16 = 80を設定すべきです
Runボタンをクリック、またはショートカットCtrl(cmd) + Enterでビデオ生成を実行

Wan2.2 Fun InP Kijai WanVideoWrapper ComfyUI ワークフロー

⚠️

この内容は準備中で、近日中に更新予定です。

このチュートリアルの一部では、Kijai/ComfyUI-WanVideoWrapperの便利な方法を紹介します。

関連モデルリポジトリ：https://huggingface.co/Kijai/WanVideo_comfy_fp8_scaled

Wan2.2 Fun InP GGUF 量子化版 ComfyUI ワークフロー

⚠️