Skip to content
ComfyUI Wiki
Ayuda a Construir una Mejor Base de Conocimientos de ComfyUI Conviértete en Patrocinador
NoticiasID-Patch: Un Nuevo Método para la Generación de Fotos Grupales Personalizadas Multi-identidad

ID-Patch: Un Nuevo Método para la Generación de Fotos Grupales Personalizadas Multi-identidad

Los Modelos de Difusión (Diffusion Models), como tecnología principal para la generación de texto a imagen, se utilizan ampliamente en la creación artística y la producción de contenido. Aunque la generación de imágenes de una sola persona se ha vuelto bastante madura, la generación de escenas con múltiples personas aún enfrenta desafíos. Los usuarios a menudo necesitan generar fotos grupales o escenas con múltiples personajes, como completar fotos de reuniones o crear anuncios con múltiples personajes.

El principal desafío actual es la fuga de características de identidad - al generar imágenes con múltiples personas, las características faciales de diferentes individuos tienden a mezclarse, dificultando mantener sus características únicas. Además, los usuarios desean un control preciso sobre la posición y pose de cada persona para lograr resultados más naturales.

Introducción al Método ID-Patch

ByteDance y la Universidad Estatal de Michigan propusieron conjuntamente el método ID-Patch. Este método ha logrado avances significativos en la preservación de identidad, control de posición y eficiencia de generación. Las innovaciones principales de ID-Patch incluyen:

  • ID Patch: Genera parches de identidad únicos para cada persona, colocados precisamente en ubicaciones específicas en la imagen condicional para lograr control espacial de la identidad.
  • ID Embedding: Combina características de identidad con incrustaciones de texto para mejorar la similitud facial y la consistencia de identidad.
  • Inferencia Eficiente: ID-Patch genera imágenes 7 veces más rápido que OMG y tiene un costo computacional menor que InstantFamily.

Muestra de Resultados

La siguiente imagen muestra una comparación entre ID-Patch y los métodos principales:

Comparación de ID-Patch con Métodos Principales

De izquierda a derecha: entrada condicional, OMG (InstantID), InstantFamily y ID-Patch. Se puede ver que ID-Patch preserva mejor la información detallada de identidad para cada persona, evitando problemas como pérdida de cabello, artefactos en las manos y confusión de identidad.

Más Ejemplos de Generación

  • Usando ID-Patch para generar imágenes con poses arbitrarias:

Generación de Imágenes con Poses Arbitrarias usando ID-Patch

  • Plug-and-play: Generación condicional con Canny Edge

Plug-and-play: Canny Edge

  • Flujo de trabajo del método ID-Patch

Flujo de Trabajo del Método ID-Patch

Descripción General del Método

El método ID-Patch logra la generación de fotos grupales personalizadas multi-identidad a través del siguiente proceso:

  1. Entrada de texto (por ejemplo, “dos personas dándose la mano”), múltiples imágenes faciales y sus posiciones.
  2. Extracción de características faciales para cada persona y generación de parches ID e incrustaciones ID.
  3. Superposición de parches ID en la imagen condicional en posiciones específicas para lograr control espacial.
  4. Combinación de incrustaciones ID con incrustaciones de texto para mejorar la similitud facial.
  5. Generación de la imagen final a través del modelo de difusión, asegurando identidad y posición precisas para cada persona.

Experimentos y Conclusiones

Los resultados experimentales muestran que ID-Patch supera a los métodos existentes en términos de similitud facial, precisión de correlación identidad-posición y eficiencia de generación. Su mecanismo único de parches y su eficiente flujo de inferencia proporcionan una nueva solución para la generación de imágenes multi-identidad.

Enlaces Relacionados


Este contenido está basado en el artículo oficial, la página del proyecto y materiales relacionados, con el objetivo de proporcionar una interpretación técnica accesible para usuarios en el campo de la generación de imágenes con IA. Para más información, visite los enlaces anteriores.