ByteDance lanza InfiniteYou: Recreación flexible de fotos manteniendo la identidad del usuario
El equipo de Creación Inteligente de ByteDance ha lanzado recientemente InfiniteYou (InfU), un nuevo marco de generación de imágenes que puede generar de manera flexible imágenes diversas y de alta calidad basadas en indicaciones de texto mientras mantiene la identidad del usuario.
Avance técnico
Lograr una generación de imágenes flexible y de alta fidelidad mientras se preserva la identidad personal sigue siendo una tarea desafiante. InfiniteYou es un marco innovador basado en avanzados Transformadores de Difusión (DiTs), particularmente el modelo FLUX, diseñado para abordar limitaciones en métodos existentes respecto a la similitud de identidad, alineación texto-imagen y calidad de generación.
Ventajas principales
InfiniteYou demuestra varias ventajas sobre los métodos existentes de generación de imágenes que preservan la identidad:
- Alta similitud de identidad: El componente InfuseNet inyecta directamente características de identidad mediante conexiones residuales, asegurando la preservación precisa de la identidad del usuario
- Superior alineación texto-imagen: Una estrategia de entrenamiento en varias etapas mejora significativamente la alineación entre las imágenes generadas y las descripciones de texto
- Alta calidad de generación y estética: Las imágenes generadas superan a los modelos de referencia existentes en términos de detalle, claridad y atractivo estético
- Reduce el problema de copiado y pegado de rostros: Genera mejor características faciales realistas basadas en indicaciones de texto, reduciendo los fenómenos de copiado y pegado directo de rostros
- Propiedad de plug-and-play: Presenta un diseño ideal de plug-and-play compatible con varios métodos y herramientas existentes
Aplicaciones prácticas
La tecnología InfiniteYou puede aplicarse a varios escenarios creativos:
- Creación de avatares personalizados
- Representación diversa para creadores de contenido
- Prueba virtual y transformación de imágenes
- Creación de contenido publicitario y de marketing personalizado
Código abierto y disponibilidad
ByteDance ha liberado el código y los modelos de InfiniteYou en GitHub como código abierto. Los desarrolladores e investigadores pueden usar su código bajo la licencia Apache 2.0, mientras que los modelos están disponibles bajo la Licencia Pública Internacional Creative Commons Attribution-NonCommercial 4.0, solo para fines de investigación académica.
Enlaces relevantes
- Repositorio GitHub: https://github.com/bytedance/InfiniteYou
- Modelo en Hugging Face: https://huggingface.co/ByteDance/InfiniteYou
- Demo en línea en Hugging Face: https://huggingface.co/spaces/ByteDance/InfiniteYou-FLUX