Qwen-Image-2512 ComfyUI ワークフローチュートリアル

Qwen-Image-2512 は、アリババの通義千問ラボが 2024 年 12 月にリリースした Qwen-Image モデルのアップデート版です。8 月にリリースされたベースバージョンと比較して、この新バージョンでは画像生成品質において複数の改善が含まれています。

主な改善点：

人間のリアリズム向上：生成された人間の画像がよりリアルで自然に見え、明らかな AI 生成アーティファクトが減少
自然なディテールの向上：風景、動物の毛皮、その他の自然要素のより詳細なレンダリング
テキストレンダリングの改善：生成された画像内のテキストがより明確で正確になり、テキストと画像の統合が向上

関連リソース：

Qwen-Image-2512 ComfyUI ネイティブワークフローガイド

ワークフローには 2 つのサブグラフが含まれています：

Text to Image (Qwen-Image 2512)：標準の 50 ステップ生成プロセス
Text to Image (Qwen-Image 2512 4steps)：Lightning LoRA を使用した 4 ステップ高速生成

1. ワークフローファイル

ComfyUI を更新した後、テンプレートからワークフローファイルを見つけるか、以下のワークフローファイルを ComfyUI にドラッグして読み込むことができます。

2. モデルのダウンロード

すべてのモデルファイルは Hugging Face または ModelScope で見つけることができます。

テキストエンコーダー

qwen_2.5_vl_7b_fp8_scaled.safetensors

LoRA モデル（オプション - 4 ステップ加速用）

より高速な生成速度が必要な場合は、Lightning LoRA を使用して生成ステップを 50 から 4 に減らすことができます：

Qwen-Image-Lightning-4steps-V1.0.safetensors

拡散モデル

ニーズに応じて、以下の 2 つのモデルのいずれかを選択できます：

qwen_image_2512_fp8_e4m3fn.safetensors （ほとんどのユーザーに推奨）
qwen_image_2512_bf16.safetensors （十分な VRAM があり、より良い画像品質が必要な場合は、このバージョンを選択できます）

VAE モデル

qwen_image_vae.safetensors

3. モデルファイルの保存場所

ダウンロード後、以下のディレクトリ構造に従ってモデルファイルを配置してください：

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 text_encoders/
│   │   └── qwen_2.5_vl_7b_fp8_scaled.safetensors
│   ├── 📂 loras/
│   │   └── Qwen-Image-Lightning-4steps-V1.0.safetensors  （オプション）
│   ├── 📂 diffusion_models/
│   │   ├── qwen_image_2512_fp8_e4m3fn.safetensors        （または qwen_image_2512_bf16.safetensors）
│   └── 📂 vae/
│       └── qwen_image_vae.safetensors

4. サポートされている画像アスペクト比

Qwen-Image-2512 は複数の画像アスペクト比をサポートしています。ニーズに応じて適切なサイズを選択できます：

アスペクト比	解像度
1:1	1328×1328
16:9	1664×928
9:16	928×1664
4:3	1472×1104
3:4	1104×1472
3:2	1584×1056
2:3	1056×1584

ヒント：より高速な生成速度が必要な場合は、4 ステップ Lightning LoRA バージョンを使用できます。生成は高速になりますが、画像品質がわずかに異なる場合があります。実際のニーズに応じて適切なバージョンを選択することをお勧めします。

Qwen-Image-2512 ComfyUI ネイティブワークフローガイド

1. ワークフローファイル

2. モデルのダウンロード

3. モデルファイルの保存場所

4. サポートされている画像アスペクト比

コメント