Flex.2-preview: 오픈소스 AI 이미지 생성 모델 출시

Flex.2-preview가 Flex.1-alpha의 후속 버전으로 오픈소스 텍스트-이미지 확산 모델로 공식 출시되었습니다. 이 모델은 완전 오픈소스이며, 80억 개의 파라미터를 보유하고, 다양한 이미지 제어 및 인페인팅 기능이 내장되어 창작자에게 더 포괄적인 이미지 생성 경험을 제공합니다.

주요 특징

Flex.2-preview는 다음과 같은 주요 특징을 갖추고 있습니다:

80억 파라미터: 강력한 파라미터 규모로 고품질 이미지 생성 보장
가이던스 임베더: 생성 속도 2배 향상
내장 인페인팅: 모델 네이티브 인페인팅 기능 지원
범용 제어 입력: 선, 포즈, 깊이 등 다양한 제어 방식 지원
미세 조정 가능: 사용자 요구에 맞는 커스텀 훈련 지원
오픈 라이선스: Apache 2.0 오픈소스 라이선스 채택
긴 텍스트 지원: 512개 토큰 입력 길이 지원
커뮤니티가 만들고 서비스하는: 완전히 커뮤니티 주도 프로젝트

개발 역사

Flex.2-preview의 발전은 여러 중요한 단계를 거쳤습니다: Flux.1 Schnell에서 OpenFlux.1로, 그리고 Flex.1-alpha를 거쳐 현재의 Flex.2-preview에 이르렀습니다.

각 단계마다 중요한 개선이 이루어졌으며, Flex.2는 지금까지 가장 큰 발전입니다. 이 프리뷰 출시는 사용자 피드백을 수집하고 커뮤니티 실험과 도구 개발을 장려하기 위한 것입니다.

ComfyUI에서 사용하기

Flex.2는 ComfyUI-FlexTools의 Flex2 Conditioner 노드를 사용하여 ComfyUI에서 사용할 수 있습니다. 또한 제어 이미지(포즈 및 깊이)를 생성하기 위해 comfyui_controlnet_aux를 함께 사용하는 것이 좋습니다.

사용 단계:

필요한 도구와 노드 설치
Flex.2-preview.safetensors를 ComfyUI 모델 디렉토리에 다운로드
ComfyUI를 재시작하고 워크플로우를 사용하여 창작 시작

Diffusers 라이브러리 사용 예시

ComfyUI 외에도 Flex.2는 Diffusers 라이브러리를 통해서도 사용할 수 있습니다. 다음은 예시입니다:

한계점 및 향후 개발

프리뷰 버전으로, Flex.2는 여전히 활발하게 개발 중이며, 다음 영역에서 개선의 여지가 있습니다:

인체 해부학적 정확성
텍스트 렌더링 품질
인페인팅 기능의 개선

개발자는 이러한 제한사항을 개선하기 위해 지속적인 훈련을 진행 중이라고 밝혔습니다.

미세 조정 및 사용자 정의

Flex.2는 미세 조정이 가능하도록 설계되었습니다. 사용자는 AI-Toolkit을 통해 LoRA 훈련을 진행하고, 자신의 데이터셋에 맞는 제어 및 인페인팅 입력을 자동으로 생성할 수 있습니다.

심지어 자신만의 제어 방식을 만들고, 간단한 LoRA 훈련을 통해 모델에게 이러한 제어 방식을 가르칠 수 있으며, 이는 일반 LoRA 훈련과 동일한 시간이 소요됩니다.