ComfyUIチャレンジ #1: 参加して100ドルを獲得
2025/08/21
WAN2.2 オープンソース版リリースとComfyUIによるDay 0ネイティブサポート
WANチームはWan2.2のオープンソース版を正式にリリースしました。これは新しいマルチモーダルビデオ生成モデルで、革新的なMoE(Mixture of Experts)アーキテクチャを採用し、ビデオ生成の品質が大きく向上しています。本モデルはApache 2.0ライセンスのもとで完全にオープンソース化されており、商用利用も可能です。
ComfyUIはWan2.2へのネイティブサポートをいち早く実現しました。これにより、ComfyUI上でWan2.2による最新のビデオ生成技術を直接体験できます。モデルは高ノイズエキスパートモデルと低ノイズエキスパートモデルで構成されており、ノイズ除去のタイムステップに応じてエキスパートモデルを分担し、高品質なビデオコンテンツを生成します。
ComfyUI公式ドキュメントにて、公式ネイティブ版のチュートリアルを公開しています。WanVideoWrapperのチュートリアルについては、近日中に更新予定です。
Wan2.2 モデルの特徴
- MoEエキスパートモデルアーキテクチャ:高ノイズエキスパートモデルが全体レイアウトを担当し、低ノイズエキスパートモデルが細部を調整
- 映画的な美的コントロール:プロフェッショナルなレンズ表現、照明・色彩・構図など多次元のビジュアルコントロールに対応
- 大規模かつ複雑な動き:多様な複雑な動きを滑らかに再現し、動きの制御性と自然さを向上
- 精密なセマンティック遵守:複雑なシーン理解や複数オブジェクト生成、創作意図の再現性向上
- 効率的な圧縮技術:2.1バージョン比で大幅なデータアップグレード、5Bバージョンは高圧縮率VAEでメモリ使用を最適化
Wan2.2 技術的進展
革新的なMoEアーキテクチャ設計
Wan2.2モデルは、MoEアーキテクチャをビデオ生成用拡散モデルに初めて適用した事例です。27Bバージョンでは高ノイズ・低ノイズのエキスパートモデルで構成され、拡散モデルのノイズ除去プロセスの段階ごとにエキスパートを分担します。高ノイズ段階では全体レイアウトを、低ノイズ段階では細部の調整を担当し、この分業により生成品質が向上します。
大規模なデータ学習の強化
Wan2.1モデルと比較して、Wan2.2は学習データが大幅に拡張され、画像データは65.6%、動画データは83.2%増加しました。データ拡張によりモデルの汎用性と創造性が向上し、複雑なシーンや美的表現、動きの生成において優れたパフォーマンスを発揮します。
美的ファインチューニングと強化学習
Wan2.2は専用の美的ファインチューニング段階を導入し、映画業界の照明設計やレンズ構図、色彩心理学の基準を統合しています。さらに強化学習(RL)技術による追加調整で、人間の美的嗜好により適合し、生成される動画がプロフェッショナルな映画基準に近づきます。
Wan2.2 モデルバージョン
オリジナルバージョン
-
Wan2.2-TI2V-5B:テキスト/画像から動画生成
https://huggingface.co/Wan-AI/Wan2.2-TI2V-5B -
Wan2.2-I2V-A14B:画像から動画への変換
https://huggingface.co/Wan-AI/Wan2.2-I2V-A14B -
Wan2.2-T2V-A14B:テキストから高品質動画生成
https://huggingface.co/Wan-AI/Wan2.2-T2V-A14B
ComfyUI再パッケージ版
https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged
📚 利用可能なバージョン
Wan2.2-TI2V-5B:FP16
Wan2.2-I2V-14B:FP16/FP8
Wan2.2-T2V-14B:FP16/FP8
ComfyUIによるWan2.2サポート
ComfyUIは、先進的なAI画像生成ワークフロー(workflow)プラットフォームとして、Wan2.2への完全なネイティブサポートを実現しました。ユーザーはComfyUI上で以下のWan2.2機能を直接利用できます:
- テキストから動画生成:シンプルなテキスト記述で高品質な動画を生成
- 画像から動画変換:静止画像を動的な動画コンテンツに変換
- ミックスモード:テキストと画像の組み合わせ入力にも対応
ComfyUIのノードベースのワークフロー(workflow)設計により、Wan2.2の利用がより柔軟かつ効率的になり、さまざまなパラメータや設定を簡単に組み合わせて最適な生成結果を得ることができます。
通義万象Webプラットフォームのアップグレード
オープンソースモデルに加え、通義万象Webプラットフォームも大幅なアップグレードが行われました。
クリエイティブ機能の刷新
- 万象Box:画像・動画コンテンツの統合的なクリエイティブエントリーポイント
- アグリゲートビュー:同一入力のタスクをまとめて表示し、継続的な編集が可能な新機能
プロジェクトコレクション機能
- プロジェクト単位のアセット管理:プロジェクトごとに動画制作を管理
- タイムライン編集:タイムライン機能でアセットの編集や配置が可能
- 動画編集・加工:ローカル編集、再描画、拡張などの操作に対応