Krea 2 オープンソース:ComfyUIネイティブ対応の12B Diffusion Transformer
Krea.aiは、テキストから画像を生成するためのオープンウェイト12.9BパラメータのDiffusion Transformer「Krea 2 Raw」および「Turbo」をリリースしました。ComfyUIはすぐに使えるワークフローでネイティブサポートしています。
2026年6月22日、Krea.ai は、自社初の基盤画像モデル Krea 2 をオープンソース化しました。これは、最高水準の美しさを追求してゼロから構築された、129億パラメータのDiffusion Transformer (DiT) です。
このモデルには2つのバリエーションがあります。Krea 2 Raw はフルベースモデルで、最大限の創造性とファインチューニングを実現します。Krea 2 Turbo は蒸留版で、わずか8ステップで高品質な画像を生成できます。どちらも Krea 2 Community License の下で9つのスタイルLoRAが付属します。
そして何より、すでにComfyUIでそのまま動作します。Comfy Org がシームレスに使用できるようにモデルを再パッケージ化したので、すぐに生成を開始できます。公式ComfyUIパッケージはHuggingFaceの Comfy-Org/Krea-2 にあります。
Krea 2 の生成サンプル。フォトリアリスティックなシーンからスタイライズドイラストまで、モデルの対応範囲を示しています。
ComfyUIでKrea 2を使用する方法
ComfyUIをインストール済みなら、今すぐKrea 2を使い始められます。Comfy Org は手動セットアップ不要ですべての詳細を処理するプリビルドワークフローを提供しています。
- Krea 2 Turboによるテキストから画像へ: 最速の方法です。モデルをダウンロードして配置し、Krea 2 Turbo T2Iワークフローを実行するだけです。2048x2048で約8ステップ必要です。
- Krea 2 APIによるテキストから画像へ: クラウドを利用したい場合は、API Krea 2 T2Iワークフローをお試しください。
- スタイル参照: 特定の見た目に合わせたいですか? API Krea 2 スタイル参照ワークフローを使用すると、参照画像とスタイルの説明を組み合わせられます。
また、Comfy Cloud で直接実行することもでき、ローカルにインストールする必要はありません。
必要なモデルファイル
Krea 2をローカルで使用するには、モデルファイルをダウンロードして、次のようにComfyUIのモデルディレクトリに配置します。
ComfyUI/models/diffusion_models/
krea2_raw_bf16.safetensors
krea2_turbo_bf16.safetensors
krea2_turbo_fp8_scaled.safetensors
krea2_turbo_nvfp4.safetensors
ComfyUI/models/loras/
krea2_darkbrush.safetensors
krea2_dotmatrix.safetensors
krea2_kidsdrawing.safetensors
krea2_neondrip.safetensors
krea2_rainywindow.safetensors
krea2_retroanime.safetensors
krea2_softwatercolor.safetensors
krea2_sunsetblur.safetensors
krea2_turbo_lora_rank_64_bf16.safetensors
krea2_vintagetarot.safetensors
ComfyUI/models/text_encoders/
qwen3vl_4b_fp8_scaled.safetensors
ComfyUI/models/vae/
qwen_image_vae.safetensorsすべてのモデルファイルは Comfy-Org/Krea-2 HuggingFaceリポジトリ から入手できます。
モデル仕様
| Krea 2 Raw | Krea 2 Turbo | |
|---|---|---|
| パラメータ | 12.9B | 12.9B |
| アーキテクチャ | Diffusion Transformer (DiT) | DiT(Rawから蒸留) |
| 推論ステップ数 | 約52 | 約8 |
| 推奨CFG | 3.5 | 0.0 |
| 最大解像度 | 2048x2048 | 2048x2048 |
| 精度 | bf16 | bf16, fp8, NVFP4 |
技術詳細
Krea 2はFLUXやStable Diffusionのファインチューンではありません。Krea独自の研究チームによってゼロからトレーニングされました。Qwen3VL-4Bテキストエンコーダを使用してプロンプトの理解を向上させ、専用のQwen Image VAE(7.7億パラメータ)で高品質なエンコード/デコードを実現しています。
TurboバリアントはRawの蒸留版で、リアルタイム使用に十分な速度で動作します。8ステップで2048x2048の高品質画像を生成し、品質を大きく損ないません。
スタイルLoRA
9つのスタイルLoRAはすべてRawチェックポイントでトレーニングされており、Turboバリアントでも使用できます。各LoRAはプロンプト内の特定のトリガーワードを使用します。
| LoRA | トリガーワード |
|---|---|
| Darkbrush | monochrome ink wash style |
| Dotmatrix | monochrome stippling style |
| Kidsdrawing | naive expressive sketch style |
| Neondrip | textured abstract style |
| Rainywindow | rainy window style |
| Retroanime | purple retro anime style |
| Softwatercolor | art deco watercolor style |
| Sunsetblur | ethereal motion blur style |
| Vintagetarot | vintage tarot style |
その他の実行方法
ComfyUIを使用しない場合、Krea 2は以下でも動作します。
公式コードベース
git clone https://github.com/krea-ai/krea-2
cd krea-2
# Turbo
uv run inference.py "a fox walking in the snow" --checkpoint oss_turbo --steps 8 --cfg 0.0 --mu 1.15 --width 2048 --height 2048
# Raw
uv run inference.py "a fox walking in the snow" --checkpoint oss_raw --steps 52 --cfg 3.5 --mu 1.15 --width 1024 --height 1024Diffusers (Python)
import torch
from diffusers import Krea2Pipeline
pipe = Krea2Pipeline.from_pretrained("krea/Krea-2-Turbo", torch_dtype=torch.bfloat16).to("cuda")
image = pipe("a fox in the snow", num_inference_steps=8, guidance_scale=0.0).images[0]
image.save("krea2.png")SGLang
sglang generate --model-path krea/Krea-2-Turbo --prompt "a red fox sitting in fresh snow, golden hour, photorealistic" --num-inference-steps 8 --height 1024 --width 1024 --save-outputライセンス
Krea 2 は Krea 2 Community License の下でオープンウェイトとしてリリースされています。非商用利用と研究を許可しています。