바이트댄스, Seaweed-7B 출시: 비용 효율적인 비디오 생성 기반 모델
2025. 04. 14.
HiDream-I1: 오픈소스 이미지 생성의 새 시대
HiDream.ai는 2025년 4월 7일에 최신 텍스트-이미지 모델 HiDream-I1을 공식적으로 오픈소스로 발표했습니다. 17B 매개변수를 가진 이 모델은 몇 초 내에 고품질 이미지를 생성할 수 있으며 여러 벤치마크 테스트에서 우수한 점수를 획득했습니다.
모델 특징
- ✨ 우수한 이미지 품질 - 사실적, 만화적, 예술적 등 다양한 스타일의 이미지 생성을 지원하며, HPSv2.1 평가에서 SOTA 결과 달성, 인간의 미적 선호도와 높은 일치성
- 🎯 탁월한 프롬프트 준수 능력 - GenEval 및 DPG 벤치마크에서 예외적으로 우수한 성능을 발휘하며 다른 모든 오픈소스 모델을 능가
- 🔓 완전 오픈소스 - MIT 라이선스로 출시되어 과학 연구 및 혁신적인 응용 프로그램 지원
- 💼 비즈니스 친화적 - 생성된 이미지는 개인 프로젝트, 과학 연구 및 상업 응용 프로그램에 자유롭게 사용 가능
사용 가능한 모델 버전
HiDream.ai는 다양한 요구를 충족하기 위해 HiDream-I1 모델의 세 가지 버전을 제공합니다:
모델 이름 | 추론 단계 | 특징 | 저장소 링크 |
---|---|---|---|
HiDream-I1-Full | 50 | 완전 버전, 최고 품질 | 🤗 HiDream-I1-Full |
HiDream-I1-Dev | 28 | 증류 버전, 효율성과 효과의 균형 | 🤗 HiDream-I1-Dev |
HiDream-I1-Fast | 16 | 고속 버전, 실시간 생성 요구에 적합 | 🤗 HiDream-I1-Fast |
기술적 하이라이트
HiDream-I1은 Mixture of Experts (MoE) 아키텍처 DiT 모델을 채택하여 이중 흐름 MMDiT 블록과 단일 흐름 DiT 블록을 결합하고, 동적 라우팅 메커니즘을 통해 컴퓨팅 리소스를 효율적으로 할당합니다. 이 모델은 OpenCLIP ViT-bigG, OpenAI CLIP ViT-L, T5-XXL, Llama-3.1-8B-Instruct와 같은 여러 텍스트 인코더를 통합하여 의미적 이해 능력을 크게 향상시켰습니다.
벤치마크 결과
DPG-Bench
모델 | 종합 | Global | Entity | Attribute | Relation | Other |
---|---|---|---|---|---|---|
PixArt-alpha | 71.11 | 74.97 | 79.32 | 78.60 | 82.57 | 76.96 |
SDXL | 74.65 | 83.27 | 82.43 | 80.91 | 86.76 | 80.41 |
DALL-E 3 | 83.50 | 90.97 | 89.61 | 88.39 | 90.58 | 89.83 |
Flux.1-dev | 83.79 | 85.80 | 86.79 | 89.98 | 90.04 | 89.90 |
SD3-Medium | 84.08 | 87.90 | 91.01 | 88.83 | 80.70 | 88.68 |
Janus-Pro-7B | 84.19 | 86.90 | 88.90 | 89.40 | 89.32 | 89.48 |
CogView4-6B | 85.13 | 83.85 | 90.35 | 91.17 | 91.14 | 87.29 |
HiDream-I1 | 85.89 | 76.44 | 90.22 | 89.48 | 93.74 | 91.83 |
GenEval
모델 | 종합 | Single Obj. | Two Obj. | Counting | Colors | Position | Color attribution |
---|---|---|---|---|---|---|---|
SDXL | 0.55 | 0.98 | 0.74 | 0.39 | 0.85 | 0.15 | 0.23 |
PixArt-alpha | 0.48 | 0.98 | 0.50 | 0.44 | 0.80 | 0.08 | 0.07 |
Flux.1-dev | 0.66 | 0.98 | 0.79 | 0.73 | 0.77 | 0.22 | 0.45 |
DALL-E 3 | 0.67 | 0.96 | 0.87 | 0.47 | 0.83 | 0.43 | 0.45 |
CogView4-6B | 0.73 | 0.99 | 0.86 | 0.66 | 0.79 | 0.48 | 0.58 |
SD3-Medium | 0.74 | 0.99 | 0.94 | 0.72 | 0.89 | 0.33 | 0.60 |
Janus-Pro-7B | 0.80 | 0.99 | 0.89 | 0.59 | 0.90 | 0.79 | 0.66 |
HiDream-I1 | 0.83 | 1.00 | 0.98 | 0.79 | 0.91 | 0.60 | 0.72 |
HPSv2.1 벤치마크
모델 | 평균 | Animation | Concept-art | Painting | Photo |
---|---|---|---|---|---|
Stable Diffusion v2.0 | 26.38 | 27.09 | 26.02 | 25.68 | 26.73 |
Midjourney V6 | 30.29 | 32.02 | 30.29 | 29.74 | 29.10 |
SDXL | 30.64 | 32.84 | 31.36 | 30.86 | 27.48 |
Dall-E3 | 31.44 | 32.39 | 31.09 | 31.18 | 31.09 |
SD3 | 31.53 | 32.60 | 31.82 | 32.06 | 29.62 |
Midjourney V5 | 32.33 | 34.05 | 32.47 | 32.24 | 30.56 |
CogView4-6B | 32.31 | 33.23 | 32.60 | 32.89 | 30.52 |
Flux.1-dev | 32.47 | 33.87 | 32.27 | 32.62 | 31.11 |
stable cascade | 32.95 | 34.58 | 33.13 | 33.29 | 30.78 |
HiDream-I1 | 33.82 | 35.05 | 33.74 | 33.88 | 32.61 |
시작하기
HiDream-I1 모델을 사용해 보려면 프로젝트의 GitHub 저장소를 방문하여 자세한 설치 및 사용 가이드를 참조하세요: HiDream-I1 GitHub 저장소
또한 Hugging Face에서 직접 모델 가중치를 다운로드할 수 있으며, 필요에 맞는 버전을 선택할 수 있습니다.
팁: 이 모델을 사용하려면 Flash Attention을 설치해야 하며, CUDA 12.4 버전이 권장됩니다. 또한 모델은 Llama-3.1-8B-Instruct를 사용하므로 적절한 네트워크 연결과 디스크 공간이 있는지 확인하세요.
관련 링크
- 제품 웹사이트: https://vivago.ai/
- GitHub 저장소: https://github.com/HiDream-ai/HiDream-I1
- Hugging Face 모델 저장소: