알리바바, ACE++ 오픈소스 공개: 학습 없이 캐릭터 일관성 이미지 생성 구현

2025년 2월 10일 — 알리바바 연구소가 차세대 AI 이미지 도구 ACE++의 오픈소스 공개를 공식 발표했습니다. 혁신적인 문맥 인식 콘텐츠 채우기 알고리즘을 기반으로, 사용자는 단일 입력 이미지만으로 캐릭터 특징의 높은 일관성을 가진 새로운 이미지를 생성할 수 있으며, 온라인 체험과 로컬 배포를 지원합니다.

핵심 기술 혁신

주요 특징

제로 트레이닝 생성: FLUX.1-Fill-dev 기본 모델을 활용하여 LoRA 적응을 통한 학습 없는 배포 실현
멀티모달 편집:
- 캐릭터 의상 변경 (의상/헤어스타일/액세서리 변경 지원)
- 장면 재구성 (배경 교체/객체 추가·제거)
- 스마트 복원 (결함 제거/화질 개선)
의미 이해: "커피잔에 증기를 추가하고 나무 테이블에 배치" 등의 복합 명령 해석 가능

기술적 돌파구

장기 컨텍스트 유닛(LCU): 이미지 콘텐츠, 텍스트 지시, 편집 영역을 동시 처리
동적 어텐션 메커니즘: 512×512 해상도에서 92.3% 특징 유지율 달성
이중 단계 최적화: 기본 복원 능력과 전문 편집 기술을 결합한 단계적 학습 접근

응용 시나리오 테스트

| ACE_plus | | |

-| | ACE_plus | |

대표적인 응용

가상 모델 의상 변경
- 평면 의상 이미지에서 다각도 표시 생성
- 피부톤/체형/장면 동적 조정 지원
영화 캐릭터 디자인
- 크로스 스타일 변환 구현 (사실적→디즈니/사이버펑크)
- 캐릭터 특징 연속성을 유지하는 다중 장면 생성
스마트 이미지 복원
- 오래된 사진의 4K 해상도 재구축
- 복잡한 가림 객체의 완벽한 제거

리소스 접근 채널

공식 입구

| 리소스 유형 | 접근 주소 | |

공식 모델 다운로드 링크

전용 적응 모델

--|

기본 의존 모델

| 모델명 | 다운로드 채널 | |

--|

기술 개발 전망

현재 버전은 복잡한 객체 처리(손 세부 정확도 62.3%)와 중국어 텍스트 지원 면에서 여전히 개선의 여지가 있습니다. 개발팀은 2025년 3분기에 비디오 연속 프레임 편집 기능을 출시하고, 연말까지 완전한 ACE++ Fully 모델을 출시할 계획을 밝혔습니다.

구체적인 워크플로우 파일은 ComfyUI Wiki 실제 테스트 후 내용 업데이트를 기다려주세요 워크플로우 업데이트 보기