Skip to content
より良い ComfyUI ナレッジベースの構築を支援する サポーターになる
ニュースStability AIがStable Virtual Cameraをリリース:2D写真を3Dビデオに変換する技術

Stability AIがStable Virtual Cameraをリリース:2D写真を3Dビデオに変換する技術

Stability AIは最近、Stable Virtual Cameraと呼ばれる新しいAIモデルを発表しました。この技術は、複雑なシーン再構築や専門的なスキルを必要とせずに、通常の2D画像をリアルな奥行きと遠近感を持つ3Dビデオに変換することができます。

Stable Virtual Cameraデモビデオ

技術的特徴と機能

Stable Virtual Cameraは、従来の仮想カメラの制御機能と生成AIの創造力を組み合わせたマルチビュー拡散モデルです。モデルの主な特徴は以下の通りです:

  • 柔軟な入力オプション:単一画像または複数画像(最大32枚)から3Dビデオを生成可能
  • 多様なカメラパス:360°回転、螺旋、ドリーズームなど、14種類の動的カメラパスをサポート
  • カスタムビューポイント制御:ユーザーがカメラアングルを指定してシーンの新しい視点を生成可能
  • 複数のアスペクト比サポート:正方形(1:1)、縦型(9:16)、横型(16:9)形式のビデオ作成が可能
  • 長時間ビデオ生成:3D一貫性を維持しながら、最大1,000フレームのビデオを生成可能

従来の3Dビデオモデルと比較して、Stable Virtual Cameraは多数の入力画像や複雑な前処理ステップを必要とせず、3Dコンテンツ作成をより簡単でアクセスしやすいものにします。この技術は新規視点合成(NVS)ベンチマークテストで優れた性能を示し、既存の複数のモデルを上回っています。

応用シナリオ

この技術は複数の分野で潜在的な応用があります:

  • 映画制作:映画制作者やアニメーターにより費用対効果の高い視覚効果ツールを提供
  • バーチャルリアリティ:VR体験を進化させるためのインタラクティブな3Dシーンを迅速に生成
  • コンテンツ作成:一般ユーザーが没入型ビデオコンテンツを作成可能に
  • 広告・マーケティング:ブランドに新しい形の視覚表現を提供

現在の制限

Stable Virtual Cameraの印象的な性能にもかかわらず、Stability AIは特定のシナリオにおいて技術に制限があることを認めています:

  • 人間、動物、または動的なテクスチャ(水など)を含む画像は、出力品質の低下を招く可能性があります
  • 非常にぼやけたシーンや不規則な形状の物体は、ちらつきのアーティファクトを生じさせる可能性があります
  • ターゲットの視点が入力画像と大きく異なる場合、品質の問題が発生する可能性があります

オープンアクセス

注目すべきは、Stability AIがこの技術をオープンソース化し、以下のチャネルを通じて利用可能にしていることです:

  • コードリポジトリ:GitHub
  • モデル:HuggingFace
  • オンラインデモ:HuggingFace Spacesを通じて利用可能

関連リンク

Stable Virtual Cameraについての詳細情報は、以下のリソースをご覧ください:

Stable Virtual Cameraのリリースは、人気のStable Diffusion画像生成モデルに続き、Stability AIの生成AI分野における重要な進歩を表し、視覚創作におけるAI応用の境界をさらに拡大しています。