Skip to content
ComfyUI Wiki
더 나은 ComfyUI 지식베이스 구축을 돕기 후원자 되기

Qwen-Image ComfyUI 네이티브, GGUF, 눈차쿠 워크플로우 완전 사용 가이드

Qwen-Image는 알리바바 통의천문 팀이 개발한 이미지 생성 기반 모델로, 20B 파라미터 MMDiT(멀티모달 확산 변환기) 아키텍처를 채택하여 Apache 2.0 라이선스로 오픈소스로 공개되었습니다. 이 모델은 이미지 생성 분야에서 독특한 기술적 우위를 보여주며, 특히 텍스트 렌더링과 이미지 편집에서 뛰어난 성능을 발휘합니다.

핵심 특징:

  • 다국어 텍스트 렌더링 능력: 영어, 중국어, 한국어, 일본어 등 다양한 언어를 포함한 이미지를 정확하게 생성할 수 있으며, 텍스트는 선명하고 읽기 쉬우며 이미지 스타일과 조화를 이룹니다
  • 풍부한 아트 스타일 지원: 사실적인 스타일부터 아트 창작, 애니메이션 스타일부터 현대 디자인까지, 프롬프트에 따라 유연하게 다양한 시각적 스타일을 전환할 수 있습니다
  • 정밀한 이미지 편집 기능: 기존 이미지에 대한 부분 수정, 스타일 변환, 콘텐츠 추가 등의 작업을 지원하며, 전체 시각적 일관성을 유지합니다

관련 리소스:

Loading...

Qwen-Image ComfyUI 네이티브 워크플로우 가이드

본 문서에 첨부된 워크플로우에서 사용되는 다양한 모델은 다음과 같습니다:

  1. Qwen-Image 원본 모델 fp8_e4m3fn
  2. 8단계 가속 버전: Qwen-Image 원본 모델 fp8_e4m3fn에 lightx2v 8단계 LoRA 사용
  3. 증류 버전: Qwen-Image 증류 버전 모델 fp8_e4m3fn

VRAM 사용량 참고 GPU: RTX4090D 24GB

사용 모델VRAM 사용량첫 생성두 번째 생성
fp8_e4m3fn86%≈ 94s≈ 71s
fp8_e4m3fn에 lightx2v 8단계 LoRA 사용86%≈ 55s≈ 34s
증류 버전 fp8_e4m3fn86%≈ 69s≈ 36s

1. 워크플로우 파일

ComfyUI 업데이트 후 템플릿에서 워크플로우 파일을 찾을 수 있거나, 아래 워크플로우를 ComfyUI로 드래그하여 로드할 수 있습니다 Qwen-image 텍스트to이미지 워크플로우

공식판 JSON 형식 워크플로우 다운로드

증류 버전

2. 모델 다운로드

ComfyOrg 저장소에서 찾을 수 있는 버전

  • Qwen-Image_bf16 (40.9 GB)
  • Qwen-Image_fp8 (20.4 GB)
  • 증류 버전 (비공식, 15단계만)

모든 모델은 Huggingface 또는 魔搭에서 찾을 수 있습니다

확산 모델

Qwen_image_distill

  • 증류 버전 원작자는 15단계 cfg 1.0을 권장
  • 테스트 결과 해당 증류 버전은 10단계 cfg 1.0에서 우수한 성능을 보이며, 원하는 이미지 유형에 따라 euler 또는 res_multistep을 선택하세요

LoRA

텍스트 인코더

VAE

모델 저장 위치

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 diffusion_models/
│   │   ├── qwen_image_fp8_e4m3fn.safetensors
│   │   └── qwen_image_distill_full_fp8_e4m3fn.safetensors ## 증류 버전
│   ├── 📂 loras/
│   │   └── Qwen-Image-Lightning-8steps-V1.0.safetensors   ## 8단계 가속 LoRA 모델
│   ├── 📂 vae/
│   │   └── qwen_image_vae.safetensors
│   └── 📂 text_encoders/
│       └── qwen_2.5_vl_7b_fp8_scaled.safetensors

3. 단계별 워크플로우 완성

단계도

  1. Load Diffusion Model 노드가 qwen_image_fp8_e4m3fn.safetensors를 로드하는지 확인
  2. Load CLIP 노드가 qwen_2.5_vl_7b_fp8_scaled.safetensors를 로드하는지 확인
  3. Load VAE 노드가 qwen_image_vae.safetensors를 로드하는지 확인
  4. EmptySD3LatentImage 노드에서 이미지 크기가 올바르게 설정되었는지 확인
  5. CLIP Text Encoder 노드에 프롬프트를 설정하세요. 현재 테스트 결과 최소한 다음 언어를 지원함: 영어, 중국어, 한국어, 일본어, 이탈리아어 등
  6. lightx2v의 8단계 가속 LoRA를 활성화하려면 선택 후 Ctrl + B로 노드를 활성화하고, 번호8 위치의 설정 매개변수에 따라 Ksampler 설정을 수정하세요
  7. Queue 버튼을 클릭하거나 단축키 Ctrl(cmd) + Enter(엔터)로 워크플로우를 실행
  8. 다양한 버전의 모델과 워크플로우에 해당하는 KSampler 매개변수 설정

증류 버전 모델과 lightx2v의 8단계 가속 LoRA는 동시에 사용할 수 없는 것 같습니다. 구체적인 조합 매개변수를 테스트하여 조합 사용 방법이 가능한지 확인해 보세요

Qwen-Image GGUF 버전 ComfyUI 워크플로우

GGUF 버전은 저사양 VRAM 사용자에게 친화적이며, 특정 웨이트 상황에서는 약 8GB의 VRAM만으로도 Qwen-Image를 실행할 수 있습니다.

VRAM 사용량 참고:

워크플로우VRAM 사용량첫 생성이후 생성
qwen-image-Q4_K_S.gguf56%≈ 135s≈ 77s
8steps LoRA 포함56%≈ 100s≈ 45s

모델 주소: Qwen-Image-gguf

1. 커스텀 노드 업데이트 또는 설치

GGUF 버전을 사용하려면 ComfyUI-GGUF 플러그인을 설치하거나 업데이트해야 합니다

자세한 내용은 ComfyUI 커스텀 노드 설치 방법을 참조하거나 Manager에서 검색하여 설치하세요

2. 워크플로우 다운로드

Qwen-Image GGUF 워크플로우

3. 모델 다운로드

GGUF 버전에서 사용되는 모델은 확산 모델만이 다른 모델들과 다릅니다

https://huggingface.co/city96/Qwen-Image-gguf 에 접속하여 임의의 웨이트를 다운로드하세요. 일반적으로 파일 크기가 클수록 품질이 우수하지만 더 높은 VRAM을 요구합니다. 본 튜토리얼에서는 다음 버전을 사용합니다:

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 diffusion_models/
│   │   └── qwen-image-Q4_K_S.gguf # 또는 선택한 다른 버전

3. 단계별 워크플로우 완성

단계도

  1. Unet Loader(GGUF) 노드가 qwen-image-Q4_K_S.gguf 또는 다운로드한 다른 버전을 로드하는지 확인
    • ComfyUI-GGUF가 설치되고 업데이트되었는지 확인하세요
  2. LightX2V 8Steps LoRA는 기본적으로 활성화되지 않으며, 선택 후 Ctrl+B로 노드를 활성화할 수 있습니다
  3. 8단계 LoRA가 활성화되지 않은 경우 기본 단계 수는 20이며, 8단계 LoRA를 활성화하면 8로 설정하세요
  4. 이곳은 대응하는 단계 수 설정 참고입니다
  5. Queue 버튼을 클릭하거나 단축키 Ctrl(cmd) + Enter(엔터)로 워크플로우를 실행

Qwen-Image 눈차쿠 버전 워크플로우

모델 주소: nunchaku-qwen-image 커스텀 노드 주소: https://github.com/nunchaku-tech/ComfyUI-nunchaku

눈차쿠 지원 대기 중