Boogu-Image-0.1-Edit: 오픈소스 통합 이미지 편집, Apache 2.0 라이선스
Boogu-Image-0.1-Edit은 Boogu-Image 계열의 Apache 2.0 라이선스 이미지 편집 모델로, 통합 멀티모달 이해 및 생성 아키텍처를 통해 명령 기반 이미지 편집을 제공합니다.
개요
Boogu-Image-0.1은 Boogu 프로젝트에서 개발한 경쟁력 있는 오픈소스 통합 이미지 생성 및 편집 모델 계열입니다. 이 계열은 세 가지 주요 변형인 Base(텍스트 기반 이미지 생성), Turbo(4단계 증류 고속 생성), Edit(이미지 기반 이미지 편집)으로 구성되며, 모두 Apache 2.0 라이선스로 출시되었습니다.
Edit 변형은 특히 명령 기반 이미지 편집에 중점을 둡니다. 사용자가 참조 이미지와 함께 원하는 편집을 설명하는 자연어 명령을 제공하면, 모델이 원본 이미지의 구조와 콘텐츠를 유지하면서 편집 결과를 생성합니다.
Boogu-Image-0.1은 Boogu Arena(LM Arena 스타일 선호도 평가)에서 경쟁력 있는 결과를 달성하여, 1,000개 이상의 다양한 테스트 프롬프트에서 폐쇄형 시스템과 선도적인 오픈소스 대안 모두에 대해 유리한 순위를 기록했습니다.
주요 기능
| 기능 | 설명 | |
|
|
| 작업 | 명령 기반 이미지 기반 이미지 편집 |
| 아키텍처 | 통합 MLLM 이해 + 확산 생성 |
| 라이선스 | Apache 2.0 (완전 오픈소스) |
| 라이브러리 | Diffusers (커스텀 BooguImagePipeline) |
| 언어 | 영어 및 중국어에 최적화 |
| ComfyUI | 네이티브 ComfyUI 지원 |
모델 아키텍처
Boogu-Image-0.1은 다음을 통합하는 통합 멀티모달 이해 및 생성 아키텍처를 사용합니다.
- 사용자 명령과 이미지 콘텐츠를 이해하기 위한 멀티모달 대규모 언어 모델(MLLM)
- 고품질 이미지 생성을 위한 확산 트랜스포머
- 잠재 공간 인코딩/디코딩을 위한 VAE
이 통합 접근 방식을 통해 모델은 높은 이미지 품질을 유지하면서도 정확한 명령 수행이 가능합니다. Edit 변형은 특히 MLLM의 공간 관계, 객체 속성 및 편집 명령 이해 능력을 활용하여 일관된 수정을 생성합니다.
기능
Boogu-Image-0.1-Edit은 다양한 이미지 편집 작업에 뛰어납니다.
- 객체 교체: 텍스트 설명에 따라 이미지 내 객체 교체
- 배경 변경: 전경 객체를 유지하면서 배경 수정
- 스타일 전송: 기존 이미지에 예술적 스타일 적용
- 로컬 편집: 텍스트 명령에 따라 특정 영역 수정
- 이중 언어 지원: 영어 및 중국어 편집 명령 처리
ComfyUI 통합
Boogu-Image-0.1-Edit은 ComfyUI에 네이티브로 지원됩니다. 공식 Boogu Image Edit 워크플로로 빠르게 시작하세요.
최신 버전의 ComfyUI로 업데이트했는지 확인하세요 (업데이트 가이드). 필수 모델 가중치는 Hugging Face의 Comfy-Org/Boogu-Image 저장소에서 확인할 수 있습니다.
온라인 데모
Boogu-Image-0.1-Edit을 브라우저에서 직접 사용해 볼 수 있습니다.
- 편집 데모: demo-edit.boogu.org
- Base 데모: demo-base.boogu.org
- Turbo 데모: demo-turbo.boogu.org
사용 가능 링크
- Hugging Face (Edit): Boogu/Boogu-Image-0.1-Edit
- Hugging Face (Base): Boogu/Boogu-Image-0.1-Base
- GitHub: boogu-project/Boogu-Image
- 프로젝트 페이지: boogu.org
- 갤러리: boogu-gallery.netlify.app
요약
Boogu-Image-0.1-Edit은 허용적인 Apache 2.0 라이선스로 오픈소스 커뮤니티에 경쟁력 있는 명령 기반 이미지 편집을 제공합니다. 통합 MLLM 아키텍처, 강력한 이중 언어 지원, 바로 사용 가능한 ComfyUI 통합을 통해 오픈소스 이미지 편집 도구의 중요한 발전을 나타냅니다.