Stability AI, Stable Virtual Camera 출시: 2D 사진을 3D 비디오로 변환하는 기술

news

Stability AI가 새로운 AI 모델 Stable Virtual Camera를 출시, 일반 사진을 실제 깊이감과 원근감을 가진 3D 비디오로 변환하여 창작자에게 직관적인 카메라 제어 제공

Stability AI는 최근 Stable Virtual Camera라는 새로운 AI 모델을 출시했습니다. 이 기술은 복잡한 장면 재구성이나 전문 기술 없이도 일반 2D 이미지를 사실적인 깊이감과 원근감을 가진 3D 비디오로 변환할 수 있습니다.

Stable Virtual Camera 데모 비디오

기술적 특징 및 기능

Stable Virtual Camera는 전통적인 가상 카메라의 제어 기능과 생성형 AI의 창의적 능력을 결합한 다중 뷰 확산 모델입니다. 이 모델의 주요 특징은 다음과 같습니다:

  • 유연한 입력 옵션: 단일 이미지 또는 여러 이미지(최대 32개)에서 3D 비디오 생성 가능
  • 다양한 카메라 경로: 360° 회전, 나선형, 돌리 줌 등 14가지 동적 카메라 경로 지원
  • 사용자 정의 시점 제어: 사용자가 카메라 각도를 지정하여 장면의 새로운 시점 생성 가능
  • 다양한 화면비율 지원: 정사각형(1:1), 세로형(9:16), 가로형(16:9) 형식의 비디오 제작 가능
  • 긴 비디오 생성: 3D 일관성을 유지하면서 최대 1,000프레임의 비디오 생성 가능

전통적인 3D 비디오 모델과 비교하여, Stable Virtual Camera는 많은 입력 이미지나 복잡한 전처리 단계가 필요하지 않아 3D 콘텐츠 제작이 더 간단하고 접근하기 쉽습니다. 이 기술은 새로운 시점 합성(NVS) 벤치마크 테스트에서 뛰어난 성능을 보이며, 기존 여러 모델을 능가하고 있습니다.

응용 시나리오

이 기술은 여러 분야에서 잠재적 응용이 가능합니다:

  • 영화 제작: 영화 제작자와 애니메이터에게 더 비용 효율적인 시각 효과 도구 제공
  • 가상 현실: VR 경험을 발전시키기 위한 인터랙티브한 3D 장면을 신속하게 생성
  • 콘텐츠 제작: 일반 사용자가 몰입형 비디오 콘텐츠를 만들 수 있도록 지원
  • 광고 및 마케팅: 브랜드에 새로운 형태의 시각적 표현 제공

현재 제한점

Stable Virtual Camera의 인상적인 성능에도 불구하고, Stability AI는 특정 시나리오에서 기술적 제한이 있음을 인정합니다:

  • 인간, 동물 또는 동적 텍스처(물과 같은)가 포함된 이미지는 출력 품질이 저하될 수 있습니다
  • 매우 흐린 장면과 불규칙한 형태의 객체는 깜빡임 현상을 일으킬 수 있습니다
  • 목표 시점이 입력 이미지와 크게 다를 경우 품질 문제가 발생할 수 있습니다

오픈 액세스

주목할만한 점은 Stability AI가 이 기술을 오픈 소스로 제공하여 다음 채널을 통해 이용할 수 있게 한 것입니다:

  • 코드 저장소: GitHub
  • 모델: HuggingFace
  • 온라인 데모: HuggingFace Spaces를 통해 이용 가능

관련 링크

Stable Virtual Camera에 대한 자세한 정보는 다음 리소스를 방문하세요:

Stable Virtual Camera 출시는 인기 있는 Stable Diffusion 이미지 생성 모델에 이어 Stability AI의 생성형 AI 분야에서 또 다른 중요한 발전을 나타내며, 시각적 창작에서 AI 응용의 경계를 더욱 확장하고 있습니다.

Stability AI, Stable Virtual Camera 출시: 2D 사진을 3D 비디오로 변환하는 기술 | ComfyUI Wiki