Qwen-Image-Layered Lancé - Modèle de Génération d’Images avec Support d’Édition par Calques

Qwen-Image-Layered est un modèle génératif capable de décomposer des images en plusieurs calques RGBA. Grâce à cette représentation par calques, chaque calque peut être édité indépendamment sans affecter le reste du contenu de l’image. Cette approche d’isolement physique permet une édition d’images plus précise et cohérente.
Caractéristiques Principales
Capacité de Décomposition par Calques
Qwen-Image-Layered peut décomposer une seule image en plusieurs calques RGBA indépendants. Chaque calque contient des composants sémantiques ou structurels spécifiques de l’image, tels que les objets au premier plan, les éléments d’arrière-plan, le texte, etc. Cette décomposition fournit la base pour les opérations d’édition ultérieures.
Édition Indépendante des Calques
Les calques décomposés peuvent être édités indépendamment de diverses manières :
- Recoloration : Modifier la couleur d’un calque spécifique tout en conservant le reste du contenu inchangé
- Remplacement de Contenu : Remplacer le contenu d’un calque par un autre contenu, comme changer une personne d’une fille à un garçon
- Modification de Texte : Modifier le contenu textuel dans les images
- Suppression d’Objets : Supprimer proprement les objets indésirables
- Redimensionnement : Ajuster la taille des objets sans distorsion
- Repositionnement : Déplacer librement les objets dans le canevas
Toutes ces opérations n’affectent que le calque cible et n’impactent pas les autres calques, garantissant la cohérence et la précision de l’édition.
Nombre Flexible de Calques
Le modèle ne limite pas le nombre de calques à une quantité fixe. Les images peuvent être décomposées en différents nombres de calques selon les besoins. Par exemple, une image peut être décomposée en 3 calques ou 8 calques, selon les exigences spécifiques.
Décomposition Récursive
Le modèle prend également en charge la décomposition récursive, où n’importe quel calque peut être décomposé davantage en sous-calques. Cette fonctionnalité permet au processus de décomposition de continuer indéfiniment, offrant une plus grande flexibilité pour les besoins d’édition complexes.
Caractéristiques Techniques
Qwen-Image-Layered est développé sur la base du modèle Qwen-Image et utilise la licence open-source Apache 2.0. Le modèle utilise le format RGBA pour représenter les calques, ce qui signifie que chaque calque contient des informations complètes de couleur et de transparence, rendant la composition entre les calques plus naturelle.
Support Natif ComfyUI
Qwen-Image-Layered a reçu un support natif dans ComfyUI, permettant aux utilisateurs d’utiliser directement le modèle pour l’édition d’images basée sur les calques dans ComfyUI. Les fichiers de workflow associés peuvent être obtenus depuis GitHub.
Applications Pratiques
Cette approche d’édition par calques est particulièrement adaptée aux scénarios nécessitant un contrôle précis sur différentes parties d’une image, tels que :
- Conception de Produits : Ajuster les couleurs des produits indépendamment sans affecter l’arrière-plan
- Création de Publicités : Remplacer ou modifier facilement le texte et les éléments dans les publicités
- Composition d’Images : Combiner précisément plusieurs éléments, chaque élément étant ajustable indépendamment
- Création de Contenu : Ajuster flexiblement divers composants dans les images
Pour les utilisateurs non techniques, cette approche d’édition par calques est également plus facile à comprendre et à utiliser, car chaque opération n’affecte que des calques spécifiques, rendant les résultats plus prévisibles.
Liens Connexes
- Page du Modèle sur Hugging Face
- Page du Modèle sur ModelScope
- Article de Recherche
- Blog du Projet
- Démo en Ligne
- Workflow ComfyUI