Skip to content
더 나은 ComfyUI 지식베이스 구축을 돕기 후원자 되기
새소식텐센트, 이미지-비디오 생성 오픈소스 모델 HunyuanVideo-I2V 공개

텐센트 후니위안, 오픈소스 비디오 생성 모델 공개

HunyuanVideo-I2V는 130억 개의 파라미터를 가진 멀티모달 대규모 언어 모델 기반의 이미지-비디오 변환 도구로, 단일 이미지로 5초 고화질 비디오를 생성할 수 있습니다. 개발자용 전체 패키지로 사전 학습 가중치, LoRA 학습 코드, 다중 플랫폼 배포 솔루션을 제공합니다.

모델 아키텍처 다이어그램

현재 모델은 huggingface에서 다운로드 가능합니다.

핵심 기능 데모

기본 비디오 생성 예시

맞춤형 효과 사례

효과 유형참조 이미지생성 결과
머리카락 성장참조 이미지
포옹 동작참조 이미지

주요 기능 특징

지능형 비디오 생성

  • 단일 이미지 입력으로 5초 HD 비디오 생성 (2K 해상도 지원)
  • 세 가지 제어 모드:
    • 텍스트 설명: “주체+동작” 명령어 제어 (예: “운동선수 다이빙 + 슬로우 모션”)
    • 오디오 동기화: 10가지 음성 스타일 지원
    • 사전 설정 템플릿: 5가지 표준 댄스 루틴 포함

개발자 지원

  • 전체 모델 가중치(130억 파라미터) 및 학습 코드 제공
  • LoRA 미세 조정 기술 지원, 커뮤니티 제작 900+ 맞춤형 모델
  • 일반용 GPU 호환 (최소 RTX 3090 필요)

실제 적용 사례

전자상거래 분야
의류 브랜드 상품 360도 전시 비디오 제작에 활용, 제작 효율 60% 향상

영상 제작
애니메이션 스튜디오 API를 통한 대량 스토리보드 생성으로 프로젝트 기간 40% 단축

창작 콘텐츠
개발자 커뮤니티에서 “만리장성 한푸 변신”, “가상 아이돌 댄스” 등 작품 제작 (사례 모음 보기)

접근 및 지원