Qwen-Image-2512 ComfyUI 워크플로우 튜토리얼

Qwen-Image-2512는 알리바바 통이천문(通义千问) 연구소가 2024년 12월에 출시한 Qwen-Image 모델의 업데이트 버전입니다. 8월에 출시된 기본 버전과 비교하여, 이 새로운 버전은 이미지 생성 품질에서 여러 가지 개선 사항을 포함하고 있습니다.

주요 개선 사항：

인간의 사실감 향상：생성된 인간 이미지가 더 사실적이고 자연스럽게 보이며, 명백한 AI 생성 아티팩트가 감소
자연 디테일 향상：풍경, 동물 털 및 기타 자연 요소의 더 상세한 렌더링
텍스트 렌더링 개선：생성된 이미지의 텍스트가 더 명확하고 정확하며, 텍스트와 이미지 간의 통합이 향상

관련 리소스：

Qwen-Image-2512 ComfyUI 네이티브 워크플로우 가이드

워크플로우에는 두 개의 하위 그래프가 포함되어 있습니다：

Text to Image (Qwen-Image 2512)：표준 50단계 생성 프로세스
Text to Image (Qwen-Image 2512 4steps)：Lightning LoRA를 사용한 4단계 빠른 생성

1. 워크플로우 파일

ComfyUI를 업데이트한 후, 템플릿에서 워크플로우 파일을 찾거나 아래의 워크플로우 파일을 ComfyUI로 드래그하여 로드할 수 있습니다.

2. 모델 다운로드

모든 모델 파일은 Hugging Face 또는 ModelScope에서 찾을 수 있습니다.

텍스트 인코더

qwen_2.5_vl_7b_fp8_scaled.safetensors

LoRA 모델（선택 사항 - 4단계 가속용）

더 빠른 생성 속도를 원하는 경우, Lightning LoRA를 사용하여 생성 단계를 50에서 4로 줄일 수 있습니다：

Qwen-Image-Lightning-4steps-V1.0.safetensors

확산 모델

필요에 따라 다음 두 모델 중 하나를 선택할 수 있습니다：

qwen_image_2512_fp8_e4m3fn.safetensors （대부분의 사용자에게 권장）
qwen_image_2512_bf16.safetensors （충분한 VRAM이 있고 더 나은 이미지 품질을 원하는 경우 이 버전을 선택할 수 있습니다）

VAE 모델

qwen_image_vae.safetensors

3. 모델 파일 저장 위치

다운로드 후, 다음 디렉토리 구조에 따라 모델 파일을 배치하세요：

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 text_encoders/
│   │   └── qwen_2.5_vl_7b_fp8_scaled.safetensors
│   ├── 📂 loras/
│   │   └── Qwen-Image-Lightning-4steps-V1.0.safetensors  （선택 사항）
│   ├── 📂 diffusion_models/
│   │   ├── qwen_image_2512_fp8_e4m3fn.safetensors        （또는 qwen_image_2512_bf16.safetensors）
│   └── 📂 vae/
│       └── qwen_image_vae.safetensors

4. 지원되는 이미지 종횡비

Qwen-Image-2512는 여러 이미지 종횡비를 지원합니다. 필요에 따라 적절한 크기를 선택할 수 있습니다：

종횡비	해상도
1:1	1328×1328
16:9	1664×928
9:16	928×1664
4:3	1472×1104
3:4	1104×1472
3:2	1584×1056
2:3	1056×1584

팁：더 빠른 생성 속도를 원하는 경우, 4단계 Lightning LoRA 버전을 사용할 수 있습니다. 생성은 더 빠르지만, 이미지 품질이 약간 다를 수 있습니다. 실제 필요에 따라 적절한 버전을 선택하는 것을 권장합니다.

Qwen-Image-2512 ComfyUI 네이티브 워크플로우 가이드

1. 워크플로우 파일

2. 모델 다운로드

3. 모델 파일 저장 위치

4. 지원되는 이미지 종횡비

댓글