ComfyUI 서브그래프 기능 공식 출시
2025. 08. 07.
Qwen-Image ComfyUI 네이티브, GGUF, 눈차쿠 워크플로우 완전 사용 가이드
Qwen-Image는 알리바바 통의천문 팀이 개발한 이미지 생성 기반 모델로, 20B 파라미터 MMDiT(멀티모달 확산 변환기) 아키텍처를 채택하여 Apache 2.0 라이선스로 오픈소스로 공개되었습니다. 이 모델은 이미지 생성 분야에서 독특한 기술적 우위를 보여주며, 특히 텍스트 렌더링과 이미지 편집에서 뛰어난 성능을 발휘합니다.
핵심 특징:
- 다국어 텍스트 렌더링 능력: 영어, 중국어, 한국어, 일본어 등 다양한 언어를 포함한 이미지를 정확하게 생성할 수 있으며, 텍스트는 선명하고 읽기 쉬우며 이미지 스타일과 조화를 이룹니다
- 풍부한 아트 스타일 지원: 사실적인 스타일부터 아트 창작, 애니메이션 스타일부터 현대 디자인까지, 프롬프트에 따라 유연하게 다양한 시각적 스타일을 전환할 수 있습니다
- 정밀한 이미지 편집 기능: 기존 이미지에 대한 부분 수정, 스타일 변환, 콘텐츠 추가 등의 작업을 지원하며, 전체 시각적 일관성을 유지합니다
관련 리소스:
Qwen-Image ComfyUI 네이티브 워크플로우 가이드
본 문서에 첨부된 워크플로우에서 사용되는 다양한 모델은 다음과 같습니다:
- Qwen-Image 원본 모델 fp8_e4m3fn
- 8단계 가속 버전: Qwen-Image 원본 모델 fp8_e4m3fn에 lightx2v 8단계 LoRA 사용
- 증류 버전: Qwen-Image 증류 버전 모델 fp8_e4m3fn
VRAM 사용량 참고 GPU: RTX4090D 24GB
사용 모델 | VRAM 사용량 | 첫 생성 | 두 번째 생성 |
---|---|---|---|
fp8_e4m3fn | 86% | ≈ 94s | ≈ 71s |
fp8_e4m3fn에 lightx2v 8단계 LoRA 사용 | 86% | ≈ 55s | ≈ 34s |
증류 버전 fp8_e4m3fn | 86% | ≈ 69s | ≈ 36s |
1. 워크플로우 파일
ComfyUI 업데이트 후 템플릿에서 워크플로우 파일을 찾을 수 있거나, 아래 워크플로우를 ComfyUI로 드래그하여 로드할 수 있습니다
공식판 JSON 형식 워크플로우 다운로드
증류 버전
2. 모델 다운로드
ComfyOrg 저장소에서 찾을 수 있는 버전
- Qwen-Image_bf16 (40.9 GB)
- Qwen-Image_fp8 (20.4 GB)
- 증류 버전 (비공식, 15단계만)
모든 모델은 Huggingface 또는 魔搭에서 찾을 수 있습니다
확산 모델
Qwen_image_distill
- 증류 버전 원작자는 15단계 cfg 1.0을 권장
- 테스트 결과 해당 증류 버전은 10단계 cfg 1.0에서 우수한 성능을 보이며, 원하는 이미지 유형에 따라 euler 또는 res_multistep을 선택하세요
LoRA
텍스트 인코더
VAE
모델 저장 위치
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 diffusion_models/
│ │ ├── qwen_image_fp8_e4m3fn.safetensors
│ │ └── qwen_image_distill_full_fp8_e4m3fn.safetensors ## 증류 버전
│ ├── 📂 loras/
│ │ └── Qwen-Image-Lightning-8steps-V1.0.safetensors ## 8단계 가속 LoRA 모델
│ ├── 📂 vae/
│ │ └── qwen_image_vae.safetensors
│ └── 📂 text_encoders/
│ └── qwen_2.5_vl_7b_fp8_scaled.safetensors
3. 단계별 워크플로우 완성
Load Diffusion Model
노드가qwen_image_fp8_e4m3fn.safetensors
를 로드하는지 확인Load CLIP
노드가qwen_2.5_vl_7b_fp8_scaled.safetensors
를 로드하는지 확인Load VAE
노드가qwen_image_vae.safetensors
를 로드하는지 확인EmptySD3LatentImage
노드에서 이미지 크기가 올바르게 설정되었는지 확인CLIP Text Encoder
노드에 프롬프트를 설정하세요. 현재 테스트 결과 최소한 다음 언어를 지원함: 영어, 중국어, 한국어, 일본어, 이탈리아어 등- lightx2v의 8단계 가속 LoRA를 활성화하려면 선택 후
Ctrl + B
로 노드를 활성화하고, 번호8
위치의 설정 매개변수에 따라 Ksampler 설정을 수정하세요 Queue
버튼을 클릭하거나 단축키Ctrl(cmd) + Enter(엔터)
로 워크플로우를 실행- 다양한 버전의 모델과 워크플로우에 해당하는 KSampler 매개변수 설정
증류 버전 모델과 lightx2v의 8단계 가속 LoRA는 동시에 사용할 수 없는 것 같습니다. 구체적인 조합 매개변수를 테스트하여 조합 사용 방법이 가능한지 확인해 보세요
Qwen-Image GGUF 버전 ComfyUI 워크플로우
GGUF 버전은 저사양 VRAM 사용자에게 친화적이며, 특정 웨이트 상황에서는 약 8GB의 VRAM만으로도 Qwen-Image를 실행할 수 있습니다.
VRAM 사용량 참고:
워크플로우 | VRAM 사용량 | 첫 생성 | 이후 생성 |
---|---|---|---|
qwen-image-Q4_K_S.gguf | 56% | ≈ 135s | ≈ 77s |
8steps LoRA 포함 | 56% | ≈ 100s | ≈ 45s |
모델 주소: Qwen-Image-gguf
1. 커스텀 노드 업데이트 또는 설치
GGUF 버전을 사용하려면 ComfyUI-GGUF 플러그인을 설치하거나 업데이트해야 합니다
자세한 내용은 ComfyUI 커스텀 노드 설치 방법을 참조하거나 Manager에서 검색하여 설치하세요
2. 워크플로우 다운로드
3. 모델 다운로드
GGUF 버전에서 사용되는 모델은 확산 모델만이 다른 모델들과 다릅니다
https://huggingface.co/city96/Qwen-Image-gguf 에 접속하여 임의의 웨이트를 다운로드하세요. 일반적으로 파일 크기가 클수록 품질이 우수하지만 더 높은 VRAM을 요구합니다. 본 튜토리얼에서는 다음 버전을 사용합니다:
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 diffusion_models/
│ │ └── qwen-image-Q4_K_S.gguf # 또는 선택한 다른 버전
3. 단계별 워크플로우 완성
Unet Loader(GGUF)
노드가qwen-image-Q4_K_S.gguf
또는 다운로드한 다른 버전을 로드하는지 확인- ComfyUI-GGUF가 설치되고 업데이트되었는지 확인하세요
LightX2V 8Steps LoRA
는 기본적으로 활성화되지 않으며, 선택 후 Ctrl+B로 노드를 활성화할 수 있습니다- 8단계 LoRA가 활성화되지 않은 경우 기본 단계 수는 20이며, 8단계 LoRA를 활성화하면 8로 설정하세요
- 이곳은 대응하는 단계 수 설정 참고입니다
Queue
버튼을 클릭하거나 단축키Ctrl(cmd) + Enter(엔터)
로 워크플로우를 실행
Qwen-Image 눈차쿠 버전 워크플로우
모델 주소: nunchaku-qwen-image 커스텀 노드 주소: https://github.com/nunchaku-tech/ComfyUI-nunchaku
눈차쿠 지원 대기 중