Krea 2 오픈소스: 12B Diffusion Transformer, ComfyUI 네이티브 지원
Krea.ai가 Krea 2 Raw 및 Turbo를 출시했습니다. 이는 129억 파라미터의 오픈 웨이트 Diffusion Transformer로 텍스트 기반 이미지 생성용입니다. ComfyUI가 바로 사용 가능한 워크플로로 네이티브 지원합니다.
2026년 6월 22일, Krea.ai가 첫 자체 기반 이미지 모델인 Krea 2를 오픈소스로 공개했습니다. 이 모델은 최고 수준의 미적 품질을 위해 처음부터 구축된 129억 파라미터의 Diffusion Transformer(DiT)입니다.
이 모델은 두 가지 버전으로 제공됩니다. Krea 2 Raw는 최대의 창의성과 파인튜닝을 위한 전체 베이스 모델입니다. Krea 2 Turbo는 단 8단계만으로 고품질 이미지를 생성할 수 있는 증류 버전입니다. 두 버전 모두 Krea 2 커뮤니티 라이선스에 따라 9개의 스타일 LoRA와 함께 제공됩니다.
그리고 가장 좋은 점은, ComfyUI에서 즉시 사용할 수 있다는 것입니다. Comfy Org가 원활한 사용을 위해 모델을 재패키징하여 바로 생성할 수 있습니다. 공식 ComfyUI 패키지는 HuggingFace의 Comfy-Org/Krea-2에서 찾을 수 있습니다.
Krea 2에서 생성된 샘플로, 포토리얼리스틱 장면부터 스타일화된 일러스트레이션까지 모델이 처리하는 방식을 보여줍니다.
ComfyUI에서 Krea 2 사용 방법
ComfyUI가 설치되어 있다면 지금 바로 Krea 2를 시작할 수 있습니다. Comfy Org가 모든 세부 사항을 처리하는 사전 구축 워크플로를 제공하므로 수동 설정이 필요하지 않습니다.
- Krea 2 Turbo를 사용한 텍스트 기반 이미지 생성: 가장 빠른 방법입니다. 모델을 다운로드하여 넣고 Krea 2 Turbo T2I 워크플로를 실행하기만 하면 됩니다. 2048x2048에서 약 8단계가 필요합니다.
- Krea 2 API를 사용한 텍스트 기반 이미지 생성: 클라우드 방식을 선호한다면 API Krea 2 T2I 워크플로를 사용해보세요.
- 스타일 참조: 특정 스타일을 일치시키고 싶나요? API Krea 2 스타일 참조 워크플로를 사용하면 참조 이미지와 스타일 설명을 결합할 수 있습니다.
로컬에 설치하지 않고 Comfy Cloud에서 직접 실행할 수도 있습니다.
필요한 모델 파일
Krea 2를 로컬에서 사용하려면 모델 파일을 다운로드하여 ComfyUI models 디렉토리에 다음과 같이 배치하세요.
ComfyUI/models/diffusion_models/
krea2_raw_bf16.safetensors
krea2_turbo_bf16.safetensors
krea2_turbo_fp8_scaled.safetensors
krea2_turbo_nvfp4.safetensors
ComfyUI/models/loras/
krea2_darkbrush.safetensors
krea2_dotmatrix.safetensors
krea2_kidsdrawing.safetensors
krea2_neondrip.safetensors
krea2_rainywindow.safetensors
krea2_retroanime.safetensors
krea2_softwatercolor.safetensors
krea2_sunsetblur.safetensors
krea2_turbo_lora_rank_64_bf16.safetensors
krea2_vintagetarot.safetensors
ComfyUI/models/text_encoders/
qwen3vl_4b_fp8_scaled.safetensors
ComfyUI/models/vae/
qwen_image_vae.safetensors모든 모델 파일은 Comfy-Org/Krea-2 HuggingFace 저장소에서 확인할 수 있습니다.
모델 사양
| Krea 2 Raw | Krea 2 Turbo | |
|---|---|---|
| 파라미터 | 12.9B | 12.9B |
| 아키텍처 | Diffusion Transformer (DiT) | DiT, Raw에서 증류 |
| 추론 단계 | 약 52 | 약 8 |
| 권장 CFG | 3.5 | 0.0 |
| 최대 해상도 | 2048x2048 | 2048x2048 |
| 정밀도 | bf16 | bf16, fp8, NVFP4 |
기술적 세부 사항
Krea 2는 FLUX나 Stable Diffusion의 파인튠이 아닙니다. Krea의 자체 연구팀이 처음부터 학습했습니다. 더 나은 프롬프트 이해를 위해 Qwen3VL-4B 텍스트 인코더를 사용하고, 고품질 인코딩 및 디코딩을 위해 전용 Qwen Image VAE(770M 파라미터)를 사용합니다.
Turbo 변형은 실시간 사용에 충분히 빠른 Raw의 증류 버전입니다. 8단계로 품질 손실 없이 견고한 2048x2048 이미지를 생성합니다.
스타일 LoRA
9개의 스타일 LoRA는 모두 Raw 체크포인트를 기반으로 학습되었으며 Turbo 변형에서도 작동합니다. 각 LoRA는 프롬프트에 특정 트리거 단어를 사용합니다.
| LoRA | 트리거 단어 |
|---|---|
| Darkbrush | monochrome ink wash style |
| Dotmatrix | monochrome stippling style |
| Kidsdrawing | naive expressive sketch style |
| Neondrip | textured abstract style |
| Rainywindow | rainy window style |
| Retroanime | purple retro anime style |
| Softwatercolor | art deco watercolor style |
| Sunsetblur | ethereal motion blur style |
| Vintagetarot | vintage tarot style |
다른 실행 방법
ComfyUI를 사용하지 않는 경우, Krea 2는 다음에서도 작동합니다.
공식 코드베이스
git clone https://github.com/krea-ai/krea-2
cd krea-2
# Turbo
uv run inference.py "a fox walking in the snow" --checkpoint oss_turbo --steps 8 --cfg 0.0 --mu 1.15 --width 2048 --height 2048
# Raw
uv run inference.py "a fox walking in the snow" --checkpoint oss_raw --steps 52 --cfg 3.5 --mu 1.15 --width 1024 --height 1024Diffusers (Python)
import torch
from diffusers import Krea2Pipeline
pipe = Krea2Pipeline.from_pretrained("krea/Krea-2-Turbo", torch_dtype=torch.bfloat16).to("cuda")
image = pipe("a fox in the snow", num_inference_steps=8, guidance_scale=0.0).images[0]
image.save("krea2.png")SGLang
sglang generate --model-path krea/Krea-2-Turbo --prompt "a red fox sitting in fresh snow, golden hour, photorealistic" --num-inference-steps 8 --height 1024 --width 1024 --save-output라이선스
Krea 2는 Krea 2 커뮤니티 라이선스에 따라 오픈 웨이트로 출시되었습니다. 비상업적 사용과 연구를 허용합니다.