알리 통의 연구소, VACE: 통합 비디오 생성 및 편집 모델 발표

비디오 조건 유닛: 텍스트, 이미지, 비디오, 마스크 등 다중 모달 입력을 통합 처리
개념 분리 전략: 비디오 내 요소(예: 인물, 배경, 동작)를 자동으로 분리하여 독립 수정 지원
맥락 적응기 구조: 확산 변환기 아키텍처를 기반으로 하여 다양한 작업에 적응하는 생성 전략 동적 조정

통의 연구소는 3월 11일 새로운 비디오 생성 및 편집 모델 VACE(비디오 생성 및 편집)를 발표했습니다. 이는 다양한 비디오 처리 기능을 통합한 AI 도구로, 통합된 프레임워크를 통해 비디오 제작 과정을 간소화하는 것을 목표로 합니다.

주요 기능 특징

VACE 모델의 핵심 장점은 "원스톱" 처리 능력으로, 전통적으로 여러 도구가 협력하여 수행해야 했던 복잡한 작업을 단일 프레임워크로 통합합니다. 구체적인 기능은 다음과 같습니다:

VACE의 가장 큰 특징은 "만능 편집"을 지원하여 사용자가 다양한 기능을 유연하게 조합할 수 있다는 점입니다:

VACE 모델은 여러 혁신 기술을 채택하고 있습니다:

이 모델은 다음과 같은 분야에 널리 활용될 수 있습니다:

VACE는 통의 연구소의 연구 팀에 의해 개발되었으며, 핵심 멤버는 Zeyinzi Jiang, Zhen Han, Chaojie Mao, Jingfeng Zhang, Yulin Pan, Yu Liu입니다.

개발 팀은 VACE의 미래 최적화 방향을 다음과 같이 제시했습니다:

VACE의 출시는 AI 비디오 제작 도구가 사용 용이성 및 통합 방향으로 발전하는 중요한 단계를 나타내며, 비디오 제작 장벽을 크게 낮추고 콘텐츠 제작자에게 보다 편리한 도구를 제공할 것으로 기대됩니다.