Boogu-Image-0.1-Edit: Édition d’image unifiée open source sous licence Apache 2.0

news

Boogu-Image-0.1-Edit est un modèle d’édition d’image sous licence Apache 2.0 de la famille Boogu-Image, offrant une édition d’image basée sur des instructions avec une architecture unifiée de compréhension et de génération multimodale.

Boogu-Image-0.1-Edit est la variante d'édition image-à-image de la famille de modèles Boogu-Image-0.1, publiée le 16 juin 2026 sous la licence permissive Apache 2.0. Elle offre des capacités d'édition d'image basées sur des instructions, pilotées par un socle unifié de compréhension et de génération multimodale (MLLM).

Présentation

Boogu-Image-0.1 est une famille de modèles open source concurrentiels de génération et d'édition d'image unifiée, développée par le projet Boogu. La famille comprend trois variantes principales : Base (texte-à-image), Turbo (génération rapide distillée en 4 étapes) et Edit (édition image-à-image), toutes publiées sous licence Apache 2.0.

La variante Edit se concentre spécifiquement sur l'édition d'image basée sur des instructions : l'utilisateur fournit une image de référence ainsi qu'une instruction en langage naturel décrivant l'édition souhaitée, et le modèle génère le résultat édité tout en préservant la structure et le contenu de l'image d'origine.

Boogu-Image-0.1 a obtenu des résultats compétitifs dans Boogu Arena (une évaluation de préférence de style LM Arena), se classant favorablement tant face aux systèmes propriétaires qu'aux alternatives open source leaders sur plus de 1 000 prompts de test variés.

Fonctionnalités clés

| Fonctionnalité | Description | |

-|

-| | Tâche | Édition image-à-image basée sur des instructions | | Architecture | Compréhension MLLM unifiée + génération par diffusion | | Licence | Apache 2.0 (entièrement open source) | | Bibliothèque | Diffusers (BooguImagePipeline personnalisé) | | Langues | Anglais et chinois optimisés | | ComfyUI | Support natif dans ComfyUI |

Architecture du modèle

Boogu-Image-0.1 utilise une architecture unifiée de compréhension et de génération multimodale qui intègre :

  • Un modèle de langage multimodal (MLLM) pour comprendre les instructions de l'utilisateur et le contenu de l'image
  • Un transformeur de diffusion pour la génération d'images de haute qualité
  • Un VAE pour l'encodage/décodage dans l'espace latent

Cette approche unifiée permet au modèle de suivre précisément les instructions tout en maintenant une haute qualité d'image. La variante Edit exploite spécifiquement la compréhension par le MLLM des relations spatiales, des attributs des objets et des instructions d'édition pour produire des modifications cohérentes.

Capacités

Boogu-Image-0.1-Edit excelle dans diverses tâches d'édition d'image :

  • Remplacement d'objets : Échanger des objets dans une image en fonction de descriptions textuelles
  • Changements d'arrière-plan : Modifier les arrière-plans tout en préservant les sujets au premier plan
  • Transfert de style : Appliquer des styles artistiques aux images existantes
  • Éditions locales : Modifier des régions spécifiques guidées par des instructions textuelles
  • Support bilingue : Gère les instructions d'édition en anglais et en chinois

Intégration ComfyUI

Boogu-Image-0.1-Edit bénéficie d'un support natif dans ComfyUI. Démarrez rapidement avec le workflow officiel Boogu Image Edit.

Assurez-vous d'avoir mis à jour ComfyUI vers la dernière version (guide de mise à jour). Les poids du modèle requis sont disponibles dans le dépôt Comfy-Org/Boogu-Image sur Hugging Face.

La variante Edit prend actuellement en charge l'édition d'une seule image de référence en résolution 1K. La prise en charge de plusieurs images de référence est prévue pour les versions futures.

Démonstrations en ligne

Vous pouvez essayer Boogu-Image-0.1-Edit directement dans votre navigateur :

Disponibilité

L'équipe Boogu ne fournit actuellement aucune API payante ni service commercial. Tout produit payant proposé sous le nom « Boogu-Image » n'est pas affilié à ce projet.

Résumé

Boogu-Image-0.1-Edit apporte une édition d'image compétitive basée sur des instructions à la communauté open source sous une licence permissive Apache 2.0. Avec son architecture MLLM unifiée, son solide support bilingue et son intégration prête à l'emploi avec ComfyUI, elle représente une avancée significative pour les outils d'édition d'image open source.

Boogu-Image-0.1-Edit: Édition d’image unifiée open source sous licence Apache 2.0 | ComfyUI Wiki