SVI 2.0 Pro 출시 - Wan 2.2 지원 무한 길이 비디오 생성
2025. 12. 29.
Qwen-Image-2512 ComfyUI 네이티브 워크플로우 사용 가이드
Qwen-Image-2512는 알리바바 통이천문(通义千问) 연구소가 2024년 12월에 출시한 Qwen-Image 모델의 업데이트 버전입니다. 8월에 출시된 기본 버전과 비교하여, 이 새로운 버전은 이미지 생성 품질에서 여러 가지 개선 사항을 포함하고 있습니다.
주요 개선 사항:
- 인간의 사실감 향상:생성된 인간 이미지가 더 사실적이고 자연스럽게 보이며, 명백한 AI 생성 아티팩트가 감소
- 자연 디테일 향상:풍경, 동물 털 및 기타 자연 요소의 더 상세한 렌더링
- 텍스트 렌더링 개선:생성된 이미지의 텍스트가 더 명확하고 정확하며, 텍스트와 이미지 간의 통합이 향상
관련 리소스:
Loading...
Qwen-Image-2512 ComfyUI 네이티브 워크플로우 가이드
워크플로우에는 두 개의 하위 그래프가 포함되어 있습니다:
- Text to Image (Qwen-Image 2512):표준 50단계 생성 프로세스
- Text to Image (Qwen-Image 2512 4steps):Lightning LoRA를 사용한 4단계 빠른 생성
1. 워크플로우 파일
ComfyUI를 업데이트한 후, 템플릿에서 워크플로우 파일을 찾거나 아래의 워크플로우 파일을 ComfyUI로 드래그하여 로드할 수 있습니다.
2. 모델 다운로드
모든 모델 파일은 Hugging Face 또는 ModelScope에서 찾을 수 있습니다.
텍스트 인코더
LoRA 모델(선택 사항 - 4단계 가속용)
더 빠른 생성 속도를 원하는 경우, Lightning LoRA를 사용하여 생성 단계를 50에서 4로 줄일 수 있습니다:
확산 모델
필요에 따라 다음 두 모델 중 하나를 선택할 수 있습니다:
- qwen_image_2512_fp8_e4m3fn.safetensors (대부분의 사용자에게 권장)
- qwen_image_2512_bf16.safetensors (충분한 VRAM이 있고 더 나은 이미지 품질을 원하는 경우 이 버전을 선택할 수 있습니다)
VAE 모델
3. 모델 파일 저장 위치
다운로드 후, 다음 디렉토리 구조에 따라 모델 파일을 배치하세요:
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 text_encoders/
│ │ └── qwen_2.5_vl_7b_fp8_scaled.safetensors
│ ├── 📂 loras/
│ │ └── Qwen-Image-Lightning-4steps-V1.0.safetensors (선택 사항)
│ ├── 📂 diffusion_models/
│ │ ├── qwen_image_2512_fp8_e4m3fn.safetensors (또는 qwen_image_2512_bf16.safetensors)
│ └── 📂 vae/
│ └── qwen_image_vae.safetensors4. 지원되는 이미지 종횡비
Qwen-Image-2512는 여러 이미지 종횡비를 지원합니다. 필요에 따라 적절한 크기를 선택할 수 있습니다:
| 종횡비 | 해상도 |
|---|---|
| 1:1 | 1328×1328 |
| 16:9 | 1664×928 |
| 9:16 | 928×1664 |
| 4:3 | 1472×1104 |
| 3:4 | 1104×1472 |
| 3:2 | 1584×1056 |
| 2:3 | 1056×1584 |
팁:더 빠른 생성 속도를 원하는 경우, 4단계 Lightning LoRA 버전을 사용할 수 있습니다. 생성은 더 빠르지만, 이미지 품질이 약간 다를 수 있습니다. 실제 필요에 따라 적절한 버전을 선택하는 것을 권장합니다.