HiDream-I1 오픈소스 출시 - 차세대 이미지 생성 모델

HiDream.ai는 2025년 4월 7일에 최신 텍스트-이미지 모델 HiDream-I1을 공식적으로 오픈소스로 발표했습니다. 17B 매개변수를 가진 이 모델은 몇 초 내에 고품질 이미지를 생성할 수 있으며 여러 벤치마크 테스트에서 우수한 점수를 획득했습니다.

모델 특징

✨ 우수한 이미지 품질 - 사실적, 만화적, 예술적 등 다양한 스타일의 이미지 생성을 지원하며, HPSv2.1 평가에서 SOTA 결과 달성, 인간의 미적 선호도와 높은 일치성
🎯 탁월한 프롬프트 준수 능력 - GenEval 및 DPG 벤치마크에서 예외적으로 우수한 성능을 발휘하며 다른 모든 오픈소스 모델을 능가
🔓 완전 오픈소스 - MIT 라이선스로 출시되어 과학 연구 및 혁신적인 응용 프로그램 지원
💼 비즈니스 친화적 - 생성된 이미지는 개인 프로젝트, 과학 연구 및 상업 응용 프로그램에 자유롭게 사용 가능

사용 가능한 모델 버전

HiDream.ai는 다양한 요구를 충족하기 위해 HiDream-I1 모델의 세 가지 버전을 제공합니다:

기술적 하이라이트

HiDream-I1은 Mixture of Experts (MoE) 아키텍처 DiT 모델을 채택하여 이중 흐름 MMDiT 블록과 단일 흐름 DiT 블록을 결합하고, 동적 라우팅 메커니즘을 통해 컴퓨팅 리소스를 효율적으로 할당합니다. 이 모델은 OpenCLIP ViT-bigG, OpenAI CLIP ViT-L, T5-XXL, Llama-3.1-8B-Instruct와 같은 여러 텍스트 인코더를 통합하여 의미적 이해 능력을 크게 향상시켰습니다.

벤치마크 결과

DPG-Bench

--
PixArt-alpha
SDXL
DALL-E 3
Flux.1-dev
SD3-Medium
Janus-Pro-7B
CogView4-6B
HiDream-I1

GenEval

-- |

-- | | SDXL | 0.55 | 0.98 | 0.74 | 0.39 | 0.85 | 0.15 | 0.23 | | PixArt-alpha | 0.48 | 0.98 | 0.50 | 0.44 | 0.80 | 0.08 | 0.07 | | Flux.1-dev | 0.66 | 0.98 | 0.79 | 0.73 | 0.77 | 0.22 | 0.45 | | DALL-E 3 | 0.67 | 0.96 | 0.87 | 0.47 | 0.83 | 0.43 | 0.45 | | CogView4-6B | 0.73 | 0.99 | 0.86 | 0.66 | 0.79 | 0.48 | 0.58 | | SD3-Medium | 0.74 | 0.99 | 0.94 | 0.72 | 0.89 | 0.33 | 0.60 | | Janus-Pro-7B | 0.80 | 0.99 | 0.89 | 0.59 | 0.90 | 0.79 | 0.66 | | HiDream-I1 | 0.83 | 1.00 | 0.98 | 0.79 | 0.91 | 0.60 | 0.72 |

HPSv2.1 벤치마크

-- |

--
Stable Diffusion v2.0
Midjourney V6
SDXL
Dall-E3
SD3
Midjourney V5
CogView4-6B
Flux.1-dev
stable cascade
HiDream-I1

시작하기

HiDream-I1 모델을 사용해 보려면 프로젝트의 GitHub 저장소를 방문하여 자세한 설치 및 사용 가이드를 참조하세요: HiDream-I1 GitHub 저장소

또한 Hugging Face에서 직접 모델 가중치를 다운로드할 수 있으며, 필요에 맞는 버전을 선택할 수 있습니다.

팁: 이 모델을 사용하려면 Flash Attention을 설치해야 하며, CUDA 12.4 버전이 권장됩니다. 또한 모델은 Llama-3.1-8B-Instruct를 사용하므로 적절한 네트워크 연결과 디스크 공간이 있는지 확인하세요.