Qwen-Image-Layered Lanzado - Modelo de Generación de Imágenes con Soporte de Edición por Capas
19/12/2025
Qwen-Image-Layered Lanzado - Modelo de Generación de Imágenes con Soporte de Edición por Capas

Qwen-Image-Layered es un modelo generativo capaz de descomponer imágenes en múltiples capas RGBA. A través de esta representación por capas, cada capa puede editarse independientemente sin afectar otro contenido en la imagen. Este enfoque de aislamiento físico permite una edición de imágenes más precisa y consistente.
Características Principales
Capacidad de Descomposición por Capas
Qwen-Image-Layered puede descomponer una sola imagen en múltiples capas RGBA independientes. Cada capa contiene componentes semánticos o estructurales específicos de la imagen, como objetos en primer plano, elementos de fondo, texto, y más. Esta descomposición proporciona la base para operaciones de edición posteriores.
Edición Independiente de Capas
Las capas descompuestas pueden editarse independientemente de varias maneras:
- Recolorización: Cambiar el color de una capa específica manteniendo todo el otro contenido sin cambios
- Reemplazo de Contenido: Reemplazar contenido dentro de una capa con otro contenido, como cambiar una persona de niña a niño
- Modificación de Texto: Modificar contenido de texto dentro de imágenes
- Eliminación de Objetos: Eliminar limpiamente objetos no deseados
- Redimensionamiento: Ajustar el tamaño de objetos sin distorsión
- Reposicionamiento: Mover objetos libremente dentro del lienzo
Todas estas operaciones solo afectan la capa objetivo y no impactan otras capas, asegurando consistencia y precisión en la edición.
Número Flexible de Capas
El modelo no limita el número de capas a una cantidad fija. Las imágenes pueden descomponerse en diferentes números de capas según sea necesario. Por ejemplo, una imagen puede descomponerse en 3 capas u 8 capas, dependiendo de los requisitos específicos.
Descomposición Recursiva
El modelo también soporta descomposición recursiva, donde cualquier capa puede descomponerse aún más en más sub-capas. Esta característica permite que el proceso de descomposición continúe infinitamente, proporcionando mayor flexibilidad para necesidades de edición complejas.
Características Técnicas
Qwen-Image-Layered se desarrolla basándose en el modelo Qwen-Image y utiliza la licencia de código abierto Apache 2.0. El modelo usa formato RGBA para representar capas, lo que significa que cada capa contiene información completa de color e información de transparencia, haciendo la composición entre capas más natural.
Soporte Nativo en ComfyUI
Qwen-Image-Layered ha recibido soporte nativo en ComfyUI, permitiendo a los usuarios usar directamente el modelo para edición de imágenes basada en capas en ComfyUI. Los archivos de flujo de trabajo relacionados se pueden obtener desde GitHub.
Aplicaciones Prácticas
Este enfoque de edición basado en capas es particularmente adecuado para escenarios que requieren control preciso sobre diferentes partes de una imagen, como:
- Diseño de Productos: Ajustar colores de productos independientemente sin afectar el fondo
- Creación de Anuncios: Reemplazar o modificar fácilmente texto y elementos en anuncios
- Composición de Imágenes: Combinar con precisión múltiples elementos, con cada elemento ajustable independientemente
- Creación de Contenido: Ajustar flexiblemente varios componentes dentro de imágenes
Para usuarios no técnicos, este enfoque de edición basado en capas también es más fácil de entender y operar, ya que cada operación solo afecta capas específicas, haciendo los resultados más predecibles.
Enlaces Relacionados
- Página del Modelo en Hugging Face
- Página del Modelo en ModelScope
- Artículo de Investigación
- Blog del Proyecto
- Demostración en Línea
- Flujo de Trabajo de ComfyUI