Stability AI, Stable Virtual Camera 출시: 2D 사진을 3D 비디오로 변환하는 기술

Stability AI는 최근 Stable Virtual Camera라는 새로운 AI 모델을 출시했습니다. 이 기술은 복잡한 장면 재구성이나 전문 기술 없이도 일반 2D 이미지를 사실적인 깊이감과 원근감을 가진 3D 비디오로 변환할 수 있습니다.

Stable Virtual Camera 데모 비디오

기술적 특징 및 기능

Stable Virtual Camera는 전통적인 가상 카메라의 제어 기능과 생성형 AI의 창의적 능력을 결합한 다중 뷰 확산 모델입니다. 이 모델의 주요 특징은 다음과 같습니다:

유연한 입력 옵션: 단일 이미지 또는 여러 이미지(최대 32개)에서 3D 비디오 생성 가능
다양한 카메라 경로: 360° 회전, 나선형, 돌리 줌 등 14가지 동적 카메라 경로 지원
사용자 정의 시점 제어: 사용자가 카메라 각도를 지정하여 장면의 새로운 시점 생성 가능
다양한 화면비율 지원: 정사각형(1:1), 세로형(9:16), 가로형(16:9) 형식의 비디오 제작 가능
긴 비디오 생성: 3D 일관성을 유지하면서 최대 1,000프레임의 비디오 생성 가능

전통적인 3D 비디오 모델과 비교하여, Stable Virtual Camera는 많은 입력 이미지나 복잡한 전처리 단계가 필요하지 않아 3D 콘텐츠 제작이 더 간단하고 접근하기 쉽습니다. 이 기술은 새로운 시점 합성(NVS) 벤치마크 테스트에서 뛰어난 성능을 보이며, 기존 여러 모델을 능가하고 있습니다.

응용 시나리오

이 기술은 여러 분야에서 잠재적 응용이 가능합니다:

영화 제작: 영화 제작자와 애니메이터에게 더 비용 효율적인 시각 효과 도구 제공
가상 현실: VR 경험을 발전시키기 위한 인터랙티브한 3D 장면을 신속하게 생성
콘텐츠 제작: 일반 사용자가 몰입형 비디오 콘텐츠를 만들 수 있도록 지원
광고 및 마케팅: 브랜드에 새로운 형태의 시각적 표현 제공

현재 제한점

Stable Virtual Camera의 인상적인 성능에도 불구하고, Stability AI는 특정 시나리오에서 기술적 제한이 있음을 인정합니다:

인간, 동물 또는 동적 텍스처(물과 같은)가 포함된 이미지는 출력 품질이 저하될 수 있습니다
매우 흐린 장면과 불규칙한 형태의 객체는 깜빡임 현상을 일으킬 수 있습니다
목표 시점이 입력 이미지와 크게 다를 경우 품질 문제가 발생할 수 있습니다

오픈 액세스

주목할만한 점은 Stability AI가 이 기술을 오픈 소스로 제공하여 다음 채널을 통해 이용할 수 있게 한 것입니다:

코드 저장소: GitHub
모델: HuggingFace
온라인 데모: HuggingFace Spaces를 통해 이용 가능

기술적 특징 및 기능

응용 시나리오

현재 제한점

오픈 액세스

관련 링크