Stability AI lanza Stable Virtual Camera: tecnología para convertir fotos 2D en videos 3D

Recientemente, Stability AI lanzó un nuevo modelo de IA llamado Stable Virtual Camera, que puede convertir imágenes 2D comunes en videos 3D con profundidad y perspectiva realistas, sin necesidad de reconstrucción de escenas complejas o habilidades profesionales.

Video de demostración de Stable Virtual Camera

Características y funciones técnicas

Stable Virtual Camera es un modelo de difusión de múltiples vistas que combina la capacidad de control de cámaras virtuales tradicionales con la creatividad de la IA generativa. Las principales características de este modelo incluyen:

Opciones de entrada flexibles: puede generar videos 3D a partir de una sola imagen o múltiples imágenes (hasta 32).
Caminos de cámara diversificados: admite 14 tipos de caminos de cámara dinámicos, incluyendo rotación de 360°, espiral, y zoom deslizante.
Control de perspectiva personalizado: los usuarios pueden especificar el ángulo de la cámara para generar nuevas perspectivas de la escena.
Soporte para múltiples relaciones de aspecto: puede generar videos en proporciones cuadradas (1:1), verticales (9:16) y horizontales (16:9).
Capacidad de generación de videos largos: puede generar videos de hasta 1000 fotogramas, manteniendo la coherencia 3D.

En comparación con los modelos de video 3D tradicionales, Stable Virtual Camera no requiere una gran cantidad de imágenes de entrada ni pasos de preprocesamiento complejos, lo que facilita la generación de contenido 3D. Esta tecnología ha demostrado un rendimiento excepcional en pruebas de referencia de síntesis de nuevas perspectivas (NVS), superando a algunos modelos existentes.

Escenarios de aplicación

Esta tecnología tiene el potencial de ser ampliamente utilizada en varios campos:

Producción cinematográfica: proporciona herramientas de efectos visuales más económicas y eficientes para creadores de películas y animaciones.
Realidad virtual: genera rápidamente escenas 3D interactivas, impulsando el desarrollo de experiencias de VR.
Creación de contenido: permite a los usuarios comunes crear contenido de video inmersivo.
Publicidad y marketing: ofrece nuevas formas de expresión visual para las marcas.

Limitaciones actuales

A pesar de su excelente rendimiento, Stability AI también ha reconocido que esta tecnología tiene limitaciones en ciertos escenarios:

Las imágenes que contienen humanos, animales o texturas dinámicas (como el agua) pueden resultar en una disminución de la calidad de salida.
Escenas muy borrosas y objetos de formas irregulares pueden generar artefactos de parpadeo.
Cuando la perspectiva objetivo difiere significativamente de la imagen de entrada, pueden surgir problemas de calidad.

Acceso abierto

Es importante destacar que Stability AI ha hecho esta tecnología de código abierto, y los usuarios pueden acceder a ella a través de los siguientes canales:

Repositorio de código: GitHub
Modelo: HuggingFace
Demostración en línea: disponible a través de HuggingFace Spaces.

Enlaces relacionados

Si desea obtener más información sobre Stable Virtual Camera, puede visitar los siguientes recursos:

El lanzamiento de Stable Virtual Camera representa otro avance importante de Stability AI en el campo de la IA generativa, ampliando aún más las aplicaciones de la IA en la creación visual, tras el éxito de su modelo de generación de imágenes Stable Diffusion.

RunComfy

Comfy Deploy

Comfy Online

Comfy.ICU

InstaSD

AMAP lanza FLUX-Text: nueva solución para edición de texto en escenas