Flux ControlNet
この記事では、Fluxエコシステム向けに現在利用可能なControlNetモデルをまとめています。
XLabs-AI/flux-controlnet-collections
XLabs-AI/flux-controlnet-collectionsは、FLUX.1-devモデル向けに提供されるControlNetチェックポイントのコレクションです。このリポジトリはBlack Forest Labsによって開発され、Fluxエコシステムにより多くの制御オプションを提供することを目的としています。
主な特徴:
-
3つのControlNetモデルをサポート:
- Canny (エッジ検出)
- HED (エッジ検出)
- Depth (深度マップ、Midasに基づく)
-
すべてのモデルは1024x1024の解像度でトレーニングされており、1024x1024の解像度の画像生成に適しています。
-
v3バージョンを提供しており、より現実的でComfyUIで直接使用可能な改良版です。
-
ComfyUI用のカスタムノードとワークフローを提供しており、ユーザーが迅速に開始できるようにしています。
-
モデルの効果を示すサンプル画像と生成結果を提供しています。
使用方法:
- 公式リポジトリのmain.pyスクリプトを使用。
- ComfyUIで提供されるカスタムノードとワークフローを使用、公式ワークフローはhttps://huggingface.co/XLabs-AI/flux-controlnet-collections/tree/main/workflowsで利用可能。
- Gradioデモインターフェースを使用。
ライセンス:
これらのモデルウェイトはFLUX.1 [dev]非商用ライセンスに従います。
リンク:
- モデルリポジトリ: https://huggingface.co/XLabs-AI/flux-controlnet-collections
- GitHubリポジトリ: ComfyUIワークフロー、トレーニングスクリプト、推論デモスクリプトを含む。
以下はXLabs-AI/flux-controlnet-collectionsリポジトリで提供されるControlNetモデルのリストです:
モデル名 | ファイルサイズ | アップロード日 | 説明 | モデルリンク | ダウンロードリンク |
---|---|---|---|---|---|
flux-canny-controlnet.safetensors | 1.49 GB | 2023年8月30日 | キャニーエッジ検出ControlNetモデル(初期バージョン) | 表示 | ダウンロード |
flux-canny-controlnet_v2.safetensors | 1.49 GB | 2023年8月30日 | キャニーエッジ検出ControlNetモデル(v2バージョン) | 表示 | ダウンロード |
flux-canny-controlnet-v3.safetensors | 1.49 GB | 2023年8月30日 | キャニーエッジ検出ControlNetモデル(v3バージョン) | 表示 | ダウンロード |
flux-depth-controlnet.safetensors | 1.49 GB | 2023年8月30日 | 深度マップControlNetモデル(初期バージョン) | 表示 | ダウンロード |
flux-depth-controlnet_v2.safetensors | 1.49 GB | 2023年8月30日 | 深度マップControlNetモデル(v2バージョン) | 表示 | ダウンロード |
flux-depth-controlnet-v3.safetensors | 1.49 GB | 2023年8月30日 | 深度マップControlNetモデル(v3バージョン) | 表示 | ダウンロード |
flux-hed-controlnet.safetensors | 1.49 GB | 2023年8月30日 | HEDエッジ検出ControlNetモデル(初期バージョン) | 表示 | ダウンロード |
flux-hed-controlnet-v3.safetensors | 1.49 GB | 2023年8月30日 | HEDエッジ検出ControlNetモデル(v3バージョン) | 表示 | ダウンロード |
このプロジェクトは、Fluxエコシステム向けに強力なControlNetモデルを提供し、特にエッジ検出や深度情報に基づく画像生成が必要なアプリケーションに適しています。
InstantX Flux Union ControlNet
InstantX Flux Union ControlNetは、FLUX.1開発バージョン向けに設計された多用途のControlNetモデルです。このモデルは複数の制御モードを統合しており、ユーザーがより柔軟に画像生成プロセスを制御できるようにします。
主な特徴:
-
複数の制御モード: キャニーエッジ検出、タイル、深度マップ、ぼかし、ポーズ制御など、さまざまな制御モードをサポート。
-
高性能: ほとんどの制御モードで高い効果を達成しており、特にキャニー、タイル、深度マップ、ぼかし、ポーズ制御モードが優れています。
-
継続的な最適化: 開発チームはモデルの性能と安定性を向上させるために継続的に改善を行っています。
-
互換性: FLUX.1開発バージョンのベースモデルと完全に互換性があり、既存のFLUXワークフローに簡単に統合できます。
-
マルチコントロール推論: 複数の制御モードを同時に使用でき、より細かい画像生成制御を提供します。
使用方法:
-
単一制御モード:
- Union ControlNetモデルをロード
- 希望する制御モードを選択(例:キャニー、深度マップなど)
- 制御画像と関連パラメータを設定
- 画像を生成
-
マルチ制御モード:
- Union ControlNetモデルをFluxMultiControlNetModelとしてロード
- 各制御モードに対して異なる制御画像とパラメータを設定
- 複数の制御モードを同時に適用して画像を生成
注意事項:
- 現在のバージョンはベータ版であり、完全にトレーニングされていない可能性があるため、使用中にいくつかの不完全な点に遭遇するかもしれません。
- 一部の制御モード(例:グレースケール制御)は効果が低い場合があるため、高効果のモードを優先的に使用することをお勧めします。
- 専門の単機能ControlNetモデルと比較して、Unionモデルは特定のタスクで若干劣る場合がありますが、より柔軟で多用途です。
リソースリンク:
- モデルダウンロード: InstantX/FLUX.1-dev-Controlnet-Union-alpha
ファイル名 | サイズ | 表示リンク | ダウンロードリンク |
---|---|---|---|
diffusion_pytorch_model.safetensors | 6.6 GB | 表示 | ダウンロード |
注意: モデルをダウンロードした後、ファイルを「flux_union_controlnet.safetensors」のようなより説明的な名前に変更することをお勧めします。これにより、将来のファイル管理と識別が容易になります。
このUnion ControlNetモデルは、Fluxエコシステム向けに強力で柔軟な画像制御ツールを提供し、特に単一モデルで複数の制御機能を実装する必要があるユーザーに適しています。継続的な最適化と更新により、Fluxプラットフォーム上で最も包括的で強力なControlNetモデルの一つになる可能性があります。
InstantX Flux Canny ControlNet
Union ControlNetモデルに加えて、InstantXはキャニーエッジ検出専用のControlNetモデルも提供しています。このモデルはキャニーエッジ検出アルゴリズムを使用して画像生成プロセスを制御し、ユーザーにより正確なエッジ制御機能を提供します。
主な特徴:
-
キャニーエッジ検出に特化: このモデルはキャニーエッジ検出に特化して最適化されており、エッジ情報の処理と利用が向上しています。
-
高解像度トレーニング: モデルは10241024の総ピクセル数でマルチスケール環境でトレーニングされ、バッチサイズ88で30kステップを使用しています。
-
FLUX.1と互換性: FLUX.1開発バージョン向けに設計されており、FLUXワークフローにシームレスに統合できます。
-
bfloat16精度を使用: モデルはbfloat16精度を使用しており、計算効率を向上させながら精度を維持します。
使用方法:
- 最新バージョンのDiffusersライブラリをインストール。
- Flux Canny ControlNetモデルとFLUX.1ベースモデルをロード。
- 入力画像を準備し、キャニーエッジ検出を適用。
- 検出されたエッジを制御入力として使用して画像を生成。
Jasperai Flux.1-dev ControlNetsシリーズ
Jasperaiは、Flux.1-dev向けに一連のControlNetモデルを開発しており、AI画像生成のためのより正確な制御を提供します。このシリーズには、表面法線、深度マップ、超解像度モデルが含まれており、ユーザーに多様なクリエイティブツールを提供します。
これらのモデルの詳細情報は、JasperaiのHugging Faceコレクションページで確認できます。
1. 表面法線ControlNetモデル
表面法線ControlNetモデルは、表面法線マップを使用して画像生成をガイドします。このモデルは特に表面法線情報に最適化されており、オブジェクト表面の幾何学的情報の処理と利用が向上しています。
主な特徴:
- 表面法線処理に特化
- オブジェクト表面の正確な幾何学的情報を提供
- 画像の深度感とリアリズムを向上
- FLUX.1開発バージョンと互換性あり
2. 深度マップControlNetモデル
深度マップControlNetモデルは、深度情報を使用して画像生成を制御します。このモデルは特に深度マップ情報に最適化されており、シーンの空間構造情報の理解と利用が向上しています。
主な特徴:
- 深度マップ処理に特化
- シーンの空間構造情報を提供
- 画像の視点と空間感を向上
- FLUX.1開発バージョンと互換性あり
3. 超解像度ControlNetモデル
超解像度ControlNetモデルは、低解像度の画像の品質を向上させることに焦点を当てています。このモデルは低品質の画像を高解像度バージョンに変換し、画像の詳細を再構築および強化します。
主な特徴:
- 画像の超解像度処理に特化
- 低解像度の画像を高解像度バージョンに変換
- 画像の詳細を再構築および強化
- FLUX.1開発バージョンと互換性あり
これらのモデルは、AI画像生成のためのより正確な制御を提供し、クリエイターがよりリアルで詳細な画像を生成できるようにします。各モデルは特定の画像処理ニーズに対応して設計されており、ユーザーに多様なクリエイティブツールを提供します。ユーザーはニーズに応じて適切なモデルを選択し、さまざまな画像生成効果を実現できます。