Skip to content
후원자 되기 더 나은 ComfyUI 지식베이스 구축을 돕기
튜토리얼 시리즈ComfyUI 고급 튜토리얼통의 Wan2.1 ComfyUI 워크플로우 - 완벽 가이드

통의 Wan2.1 ComfyUI 워크플로우

알리바바가 2025년 2월에 오픈소스로 공개한 Wan2.1은 현재 비디오 생성 분야의 표준 모델입니다. Apache 2.0 라이선스로 제공되며, 14B(140억 매개변수)와 1.3B(13억 매개변수) 두 가지 버전으로 제공됩니다. 텍스트 생성 비디오(T2V), 이미지 생성 비디오(I2V) 등 다양한 작업을 지원합니다. 이 모델은 성능 면에서 기존 오픈소스 모델을 뛰어넘을 뿐만 아니라, 더 중요한 것은 경량 버전이 8GB 비디오 메모리만으로도 실행 가능하여 사용 진입장벽을 크게 낮췄다는 점입니다.

현재 모든 모델은 Hugging Face와 ModelScope 플랫폼에서 다운로드할 수 있습니다:

이 글에서는 다음과 같은 Wan2.1 관련 워크플로우를 완성하는 방법을 안내합니다:

  • Wan2.1 관련 모델 설치
  • Wan2.1 이미지 생성 비디오 워크플로우
  • Wan2.1 텍스트 생성 비디오 워크플로우

또한 현재 커뮤니티 작성자가 GGUF 및 양자화 버전을 제작했습니다

통의 Wan2.1 ComfyUI 공식 워크플로우 예제

다음 워크플로우는 ComfyUI 공식 블로그에서 가져온 것으로, 현재 ComfyUI는 Wan2.1을 기본적으로 지원합니다

1. Wan2.1 관련 설치

  1. ComfyUI를 최신 버전으로 업데이트

ComfyUI 버전을 최신 버전으로 업그레이드해야 합니다. ComfyUI 업그레이드 방법 부분 가이드를 참조하여 업그레이드를 완료하세요.

  1. Diffusion models 모델 설치

Diffusion models

Comfy의 repackaged에서 필요한 워크플로우 유형에 따라 모델 버전을 다운로드하세요

  • i2vimage to video 즉 이미지 생성 비디오 모델, t2vtext to video 즉 텍스트 생성 비디오 모델입니다
  • 14B, 1.3B는 해당 매개변수 수량으로, 수치가 클수록 하드웨어 성능 요구사항이 높아집니다
  • bf16, fp16, fp8은 다양한 정밀도를 나타내며, 정밀도가 높을수록 하드웨어 성능 요구사항이 높아집니다. fp8은 정밀도가 가장 낮아 하드웨어 성능 요구사항이 가장 낮지만, 효과도 상대적으로 떨어집니다
  • 일반적으로 파일 크기가 클수록 장치의 하드웨어 요구사항도 높아집니다

다운로드한 모델은 ComfyUI/models/diffusion_models 디렉토리에 저장하세요

  1. text encoders 모델 설치

umt5_xxl_fp8_e4m3fn_scaled.safetensors 다운로드

다운로드가 응답하지 않으면 이 링크를 방문하여 다운로드하세요

다운로드한 모델은 ComfyUI/models/text_encoders 디렉토리에 저장하세요

  1. clip_vision 모델 설치

clip_vision_h.safetensors 다운로드

다운로드가 응답하지 않으면 이 링크를 방문하여 다운로드하세요

다운로드한 모델은 ComfyUI/models/clip_vision 디렉토리에 저장하세요

  1. Wan2.1 VAE 모델 설치

wan_2.1_vae.safetensors 다운로드

다운로드가 응답하지 않으면 이 링크를 방문하여 다운로드하세요

다운로드한 모델은 ComfyUI/models/vae 디렉토리에 저장하세요

2. Wan2.1 이미지 생성 비디오 워크플로우

다음 두 워크플로우는 기본 노드가 동일하며, 차이점은 사용된 Diffusion Model과 해당 비디오 크기입니다. 아래 제공된 워크플로우 파일을 각각 사용하거나, 그 중 하나를 사용한 다음 튜토리얼 지침에 따라 매개변수를 수정할 수 있습니다.

2.1 Wan2.1 이미지 생성 비디오 워크플로우 14B 720P Workflow

워크플로우 파일 다운로드 아래 버튼을 클릭하여 해당 워크플로우를 다운로드한 다음, ComfyUI 인터페이스로 드래그하거나 메뉴 바의 Workflows -> Open(Ctrl+O)를 사용하여 로드하세요

입력 이미지 예제 입력으로 사용할 이 이미지를 다운로드하세요 Wan2.1 이미지 생성 비디오 워크플로우 14B 720P Workflow 입력 이미지 예제

Wan2.1 이미지 생성 비디오 720P 워크플로우 설명 Wan2.1 이미지 생성 비디오 워크플로우 14B 720P Workflow

이미지 번호를 참조하여 해당 노드와 모델이 모두 로드되었는지 확인하여 모델이 정상적으로 실행되도록 하세요

  1. 앞서 제공한 입력 이미지 예제를 업로드하세요
  2. [clip_vision_h.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/clip_vision/clip_vision_h.safetensors?download=true) 모델이 정상적으로 읽히고 로드되는지 확인하세요
  3. [umt5_xxl_fp8_e4m3fn_scaled.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/text_encoders/umt5_xxl_fp8_e4m3fn_scaled.safetensors?download=true) 모델이 정상적으로 읽히고 로드되는지 확인하세요
  4. 720P 모델을 사용하고 정상적으로 읽을 수 있는지 확인하세요. 다운로드하지 않았다면 여기를 클릭하여 다운로드하세요. 장치 성능에 따라 다음 중 하나를 선택하세요
    • wan2.1_i2v_720p_14B_bf16.safetensors
    • wan2.1_i2v_720p_14B_fp8_e4m3fn.safetensors
  5. [wan_2.1_vae.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/vae/wan_2.1_vae.safetensors?download=true) 모델이 정상적으로 읽히고 로드되는지 확인하세요
  6. Queue 버튼을 클릭하거나 단축키 Ctrl(cmd) + Enter(엔터)를 사용하여 비디오 생성을 실행하세요
  7. wanImageToVideo 노드의 크기가 768x768인지 확인할 수 있습니다

2.2 Wan2.1 이미지 생성 비디오 워크플로우 14B 480P Workflow

480P 워크플로우는 720P 워크플로우와 유사하며, 주요 차이점은 LoadDiffusion Model 노드가 480P 모델을 로드하고 wanImageToVideo 노드의 크기가 512x512라는 점입니다

워크플로우 파일 다운로드 아래 버튼을 클릭하여 해당 워크플로우를 다운로드한 다음, ComfyUI 인터페이스로 드래그하거나 메뉴 바의 Workflows -> Open(Ctrl+O)를 사용하여 로드하세요

입력 이미지 예제 입력으로 사용할 아래 이미지를 다운로드하세요 flux_dev_example

Wan2.1 이미지 생성 비디오 480P 워크플로우 설명 Wan2.1 이미지 생성 비디오 워크플로우 14B 480P Workflow

Wan2.1 이미지 생성 비디오 480P 워크플로우 설명 Wan2.1 이미지 생성 비디오 워크플로우 14B 480P Workflow

이미지 번호를 참조하여 해당 노드와 모델이 모두 로드되었는지 확인하여 모델이 정상적으로 실행되도록 하세요

  1. 앞서 제공한 입력 이미지 예제를 업로드하세요
  2. [clip_vision_h.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/clip_vision/clip_vision_h.safetensors?download=true) 모델이 정상적으로 읽히고 로드되는지 확인하세요
  3. [umt5_xxl_fp8_e4m3fn_scaled.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/text_encoders/umt5_xxl_fp8_e4m3fn_scaled.safetensors?download=true) 모델이 정상적으로 읽히고 로드되는지 확인하세요
  4. 480P 모델을 사용하고 정상적으로 읽을 수 있는지 확인하세요. 다운로드하지 않았다면 여기를 클릭하여 다운로드하세요. 장치 성능에 따라 다음 중 하나를 선택하세요
    • wan2.1_i2v_480p_14B_bf16.safetensors
    • wan2.1_i2v_480p_14B_fp8_e4m3fn.safetensors
  5. [wan_2.1_vae.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/vae/wan_2.1_vae.safetensors?download=true) 모델이 정상적으로 읽히고 로드되는지 확인하세요
  6. Queue 버튼을 클릭하거나 단축키 Ctrl(cmd) + Enter(엔터)를 사용하여 비디오 생성을 실행하세요
  7. wanImageToVideo 노드의 크기가 512x512인지 확인할 수 있습니다

3. Wan2.1 이미지 생성 비디오 워크플로우 1.3B 1080P Workflow

아래 버튼을 클릭하여 해당 워크플로우를 다운로드한 다음, ComfyUI 인터페이스로 드래그하거나 메뉴 바의 Workflows -> Open(Ctrl+O)를 사용하여 로드하세요

Wan2.1 이미지 생성 비디오 워크플로우 1.3B 1080P Workflow

이미지 번호를 참조하여 해당 노드와 모델이 모두 로드되었는지 확인하여 모델이 정상적으로 실행되도록 하세요

  1. [umt5_xxl_fp8_e4m3fn_scaled.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/text_encoders/umt5_xxl_fp8_e4m3fn_scaled.safetensors?download=true) 모델이 정상적으로 읽히고 로드되는지 확인하세요
  2. t2v 모델을 사용하고 정상적으로 읽을 수 있는지 확인하세요. 다운로드하지 않았다면 여기를 클릭하여 다운로드하세요. 장치 성능에 따라 다음 중 하나를 선택하세요
    • wan2.1_t2v_1.3B_bf16.safetensors
    • wan2.1_t2v_1.3B_fp16.safetensors
    • wan2.1_t2v_14B_bf16.safetensors
    • wan2.1_t2v_14B_fp8_e4m3fn.safetensors
  3. [wan_2.1_vae.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/vae/wan_2.1_vae.safetensors?download=true) 모델이 정상적으로 읽히고 로드되는지 확인하세요
  4. Queue 버튼을 클릭하거나 단축키 Ctrl(cmd) + Enter(엔터)를 사용하여 비디오 생성을 실행하세요

Wan2.1 양자화 버전 워크플로우

이 버전은 Kijai가 제공하며, 플러그인과 함께 사용해야 합니다 다음 두 플러그인을 설치해야 합니다:

Wan2.1 양자화 버전 관련 모델 다운로드

관련 모델은 모두 Kijai/WanVideo_comfy에서 가져왔습니다

Text encoders 모델

장치에 따라 fp8 또는 bf16 버전을 선택하여 다음 파일을 다운로드하고 ComfyUI/models/text_encoders 폴더에 저장하세요

fp8 버전은 장치 성능 요구사항이 상대적으로 낮고, bf16 버전은 장치 성능 요구사항이 상대적으로 높습니다

Diffusion models

장치와 필요한 워크플로우에 따라 해당 Transformer 모델 파일ComfyUI/models/diffusion_models 폴더에 다운로드하세요

해당 모델 파일 매개변수 설명: 1. 모델 유형

  • I2V: Image to Video, 이미지 생성 비디오 모델
  • T2V: Text to Video, 텍스트 생성 비디오 모델

2. 모델 규모

  • 14B: 140억 매개변수 버전, 효과가 더 좋지만 하드웨어 요구사항이 더 높음
  • 1_3B: 13억 매개변수 버전, 하드웨어 요구사항이 상대적으로 낮지만 효과도 상대적으로 단순함

3. 해상도

  • 480P: 512x512 해상도의 비디오 생성
  • 720P: 768x768 해상도의 비디오 생성

4. 정밀도 형식

  • bf16: Brain Floating Point 16, 정밀도가 높으며 최신 GPU 지원 필요
  • fp8: Floating Point 8, 정밀도가 낮으며 하드웨어 요구사항이 낮음
  • fp16: Floating Point 16, 중간 정밀도로 대부분의 GPU에 적합
  • e4m3fn: 8비트 부동소수점 형식의 일종으로 저정밀도 계산에 최적화됨

VAE 모델

장치에 따라 fp8 또는 bf16 버전을 선택하여 다음 파일을 다운로드하고 ComfyUI/models/vae 폴더에 저장하세요

Wan2.1 양자화 버전 워크플로우

Wan2.1 양자화 버전 텍스트 생성 비디오 워크플로우

아래 버튼을 클릭하여 해당 워크플로우를 다운로드한 다음, ComfyUI 인터페이스로 드래그하거나 메뉴 바의 Workflows -> Open(Ctrl+O)를 사용하여 로드하세요

워크플로우 설명 Wan2.1 양자화 버전 텍스트 생성 비디오 워크플로우

이미지 번호를 참조하여 해당 노드와 모델이 모두 로드되었는지 확인하여 모델이 정상적으로 실행되도록 하세요

  1. [umt5-xxl-enc-bf16.safetensors](https://huggingface.co/Kijai/WanVideo_comfy/blob/main/umt5-xxl-enc-bf16.safetensors) 모델이 정상적으로 읽히고 로드되는지 확인하세요
  2. t2v 모델을 사용하고 정상적으로 읽을 수 있는지 확인하세요. 다운로드하지 않았다면 여기를 클릭하여 다운로드하세요. 장치 성능에 따라 다음 중 하나를 선택하세요
  3. Wan2_1_VAE_xxx.safetensors 모델이 정상적으로 읽히고 로드되는지 확인하세요
  4. Queue 버튼을 클릭하거나 단축키 Ctrl(cmd) + Enter(엔터)를 사용하여 비디오 생성을 실행하세요

Wan2.1 양자화 버전 이미지 생성 비디오 480P 워크플로우

CLIP 모델 다운로드

워크플로우 다운로드 아래 버튼을 클릭하여 해당 워크플로우를 다운로드한 다음, ComfyUI 인터페이스로 드래그하거나 메뉴 바의 Workflows -> Open(Ctrl+O)를 사용하여 로드하세요

워크플로우 설명 Wan2.1 양자화 버전 이미지 생성 비디오 480P 워크플로우 설명

이미지 번호를 참조하여 해당 노드와 모델이 모두 로드되었는지 확인하여 모델이 정상적으로 실행되도록 하세요

  1. umt5-xxl-enc-bf16.safetensors 모델이 정상적으로 읽히고 로드되는지 확인하세요. 다운로드 링크: umt5-xxl-enc-bf16.safetensors
  2. open-clip-xlm-roberta-large-vit-huge-14_fp16.safetensors 모델이 정상적으로 읽히고 로드되는지 확인하세요. 다운로드 링크: open-clip-xlm-roberta-large-vit-huge-14_fp16.safetensors
  3. Wan2_1_VAE_bf16.safetensors 모델이 정상적으로 읽히고 로드되는지 확인하세요. 다운로드 링크: Wan2_1_VAE_bf16.safetensors
  4. 비디오로 생성하고 싶은 이미지를 업로드하세요
  5. Wan2_1-I2V-14B-480P_fp8_e4m3fn.safetensors 모델이 정상적으로 읽히고 로드되는지 확인하세요. 다운로드 링크: Wan2_1-I2V-14B-480P_fp8_e4m3fn.safetensors
  6. 프롬프트 입력 상자에 생성하고 싶은 비디오에 대한 설명을 입력하세요
  7. Queue 버튼을 클릭하거나 단축키 Ctrl(cmd) + Enter(엔터)를 사용하여 비디오 생성을 실행하세요

Wan2.1 양자화 버전 비디오 변환 비디오 워크플로우

워크플로우 다운로드 아래 버튼을 클릭하여 해당 워크플로우를 다운로드한 다음, ComfyUI 인터페이스로 드래그하거나 메뉴 바의 Workflows -> Open(Ctrl+O)를 사용하여 로드하세요

워크플로우 설명 Wan2.1 양자화 버전 비디오 변환 비디오 워크플로우

이미지 번호를 참조하여 해당 노드와 모델이 모두 로드되었는지 확인하여 모델이 정상적으로 실행되도록 하세요

  1. umt5-xxl-enc-bf16.safetensors 모델이 정상적으로 읽히고 로드되는지 확인하세요. 다운로드 링크: umt5-xxl-enc-bf16.safetensors
  2. 변환하고 싶은 원본 비디오를 업로드하세요
  3. Wan2_1-T2V-1_3B_bf16.safetensors 모델이 정상적으로 읽히고 로드되는지 확인하세요. 다운로드 링크: Wan2_1-T2V-1_3B_bf16.safetensors
  4. 생성하고 싶은 비디오에 대한 설명을 입력하세요
  5. Wan2_1_VAE_bf16.safetensors 모델이 정상적으로 읽히고 로드되는지 확인하세요. 다운로드 링크: Wan2_1_VAE_bf16.safetensors
  6. Queue 버튼을 클릭하거나 단축키 Ctrl(cmd) + Enter(엔터)를 사용하여 비디오 생성을 실행하세요

관련 리소스