WAN2.2 오픈소스 버전 출시 및 ComfyUI Day 0 네이티브 지원
2025. 07. 28.
WAN2.2 오픈소스 버전 출시 및 ComfyUI Day 0 네이티브 지원
WAN 팀이 Wan2.2 오픈소스 버전을 공식적으로 출시했습니다! 이 모델은 새로운 멀티모달 영상 생성 모델로, MoE(Mixture of Experts) 아키텍처를 도입하여 영상 생성 품질을 한층 높였습니다. 해당 모델은 Apache 2.0 라이선스 하에 완전한 오픈소스로 공개되었으며, 상업적 사용도 가능합니다.
ComfyUI는 Wan2.2에 대해 Day 0부터 네이티브 지원을 제공합니다. 이제 ComfyUI에서 Wan2.2의 영상 생성 기술을 바로 체험할 수 있습니다. 이 모델은 고노이즈 전문가 모델과 저노이즈 전문가 모델로 구성되어, 노이즈 제거 단계에 따라 역할을 분담하여 더 높은 품질의 영상을 생성할 수 있습니다.
ComfyUI 공식 문서에 네이티브 버전 튜토리얼이 완성되어 있습니다. WanVideoWrapper 튜토리얼은 곧 업데이트될 예정입니다.
Wan2.2 모델 주요 특징
- MoE 전문가 모델 아키텍처: 고노이즈 전문가 모델이 전체 레이아웃을 담당하고, 저노이즈 전문가 모델이 세부를 다듬습니다.
- 시네마틱 미학 제어: 전문적인 렌즈 언어, 조명·색상·구도 등 다차원 시각 제어 지원
- 대규모 복잡한 동작: 다양한 복잡한 동작을 자연스럽게 재현하여 동작 제어성과 자연스러움 향상
- 정확한 의미 준수: 복잡한 장면 이해, 다중 객체 생성, 창작 의도 재현력 강화
- 효율적인 압축 기술: 2.1 버전 대비 데이터 대폭 업그레이드, 5B 버전은 고압축률 VAE로 메모리 사용 최적화
Wan2.2 기술적 발전
혁신적인 MoE 아키텍처 설계
Wan2.2 모델은 MoE 아키텍처를 영상 생성 확산 모델에 성공적으로 적용한 첫 사례입니다. 27B 버전은 고노이즈·저노이즈 전문가 모델로 구성되어, 확산 모델의 노이즈 제거 단계별로 역할을 분담합니다. 고노이즈 단계에서는 전체 레이아웃을, 저노이즈 단계에서는 세부를 다듬어 생성 품질을 높입니다.
대규모 데이터 학습 강화
Wan2.1과 비교해 Wan2.2는 학습 데이터가 크게 확장되었습니다. 이미지 데이터는 65.6%, 영상 데이터는 83.2% 증가하여, 모델의 일반화 능력과 창의적 다양성이 향상되었습니다. 복잡한 장면, 미적 표현, 동작 생성 등에서 뛰어난 성능을 보입니다.
미학 파인튜닝 및 강화학습
Wan2.2는 전용 미학 파인튜닝 단계를 도입하여, 영화 산업의 조명 설계, 렌즈 구도, 색채 심리학 기준을 통합했습니다. 강화학습(RL) 기술을 추가로 적용해, 인간의 미적 선호에 더 잘 맞는 영상을 생성할 수 있습니다.
Wan2.2 모델 버전
오리지널 버전
-
Wan2.2-TI2V-5B: 텍스트/이미지 → 영상 생성
https://huggingface.co/Wan-AI/Wan2.2-TI2V-5B -
Wan2.2-I2V-A14B: 이미지 → 영상 변환
https://huggingface.co/Wan-AI/Wan2.2-I2V-A14B -
Wan2.2-T2V-A14B: 텍스트 → 고품질 영상 생성
https://huggingface.co/Wan-AI/Wan2.2-T2V-A14B
ComfyUI 리패키지 버전
https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged
📚 사용 가능한 버전
Wan2.2-TI2V-5B: FP16
Wan2.2-I2V-14B: FP16/FP8
Wan2.2-T2V-14B: FP16/FP8
ComfyUI의 Wan2.2 지원
ComfyUI는 AI 이미지 생성 워크플로우(workflow) 플랫폼으로, Wan2.2를 완전하게 네이티브로 지원합니다. 사용자는 ComfyUI에서 다양한 Wan2.2 기능을 바로 사용할 수 있습니다.
- 텍스트 → 영상 생성: 간단한 텍스트 설명만으로 고품질 영상 생성
- 이미지 → 영상 변환: 정적인 이미지를 동적인 영상 콘텐츠로 변환
- 혼합 모드: 텍스트와 이미지 입력을 함께 지원
ComfyUI의 노드 기반 워크플로우(workflow) 설계로 Wan2.2를 더욱 유연하고 효율적으로 사용할 수 있으며, 다양한 파라미터와 설정을 쉽게 조합해 최적의 결과를 얻을 수 있습니다.
통역 만상 웹 플랫폼 업그레이드
오픈소스 모델 외에도, 통역 만상 웹 플랫폼 역시 다양한 업그레이드가 이루어졌습니다.
창작 기능 리뉴얼
- 만상 박스: 이미지·영상 통합 창작 진입점 제공
- 집계 보기: 동일 입력 작업을 모아 연속 편집이 가능한 집계 보기 기능 추가
프로젝트 단위 관리 기능
- 프로젝트별 자산 관리: 프로젝트 단위로 영상 창작 관리
- 타임라인 편집: 타임라인 기능 제공, 자산 편집 및 배열 지원
- 영상 편집 및 처리: 로컬 편집, 다시 그리기, 확장 등 다양한 작업 지원