Black Forest Labs выпускает открытую версию FLUX.1 Krea [dev] с нативной поддержкой ComfyUI
31.07.2025
HiDream-I1: Новая эра в генерации изображений с открытым исходным кодом
HiDream.ai официально открыл исходный код своей последней модели генерации изображений из текста HiDream-I1 7 апреля 2025 года. С 17B параметрами эта модель может генерировать высококачественные изображения за секунды и достигла ведущих результатов в множественных тестах бенчмарков.
Особенности модели
- ✨ Превосходное качество изображений - Поддерживает реалистичные, мультипликационные, художественные и различные другие стили изображений, достигая результатов SOTA в оценке HPSv2.1, высоко согласованных с человеческими эстетическими предпочтениями
- 🎯 Отличное следование промптам - Показывает исключительно хорошие результаты в бенчмарках GenEval и DPG, превосходя все другие модели с открытым исходным кодом
- 🔓 Полностью открытый исходный код - Выпущена под лицензией MIT, поддерживая научные исследования и инновационные приложения
- 💼 Дружественная к бизнесу - Сгенерированные изображения могут свободно использоваться для личных проектов, научных исследований и коммерческих приложений
Доступные версии модели
HiDream.ai предлагает три версии модели HiDream-I1 для удовлетворения различных потребностей:
Название модели | Шаги вывода | Особенности | Ссылка на репозиторий |
---|---|---|---|
HiDream-I1-Full | 50 | Полная версия, лучшее качество | 🤗 HiDream-I1-Full |
HiDream-I1-Dev | 28 | Дистиллированная версия, баланс эффективности и результативности | 🤗 HiDream-I1-Dev |
HiDream-I1-Fast | 16 | Быстрая версия, подходящая для потребностей генерации в реальном времени | 🤗 HiDream-I1-Fast |
Технические особенности
HiDream-I1 использует архитектуру DiT модели Mixture of Experts (MoE), комбинируя блоки MMDiT с двойным потоком с блоками DiT с одинарным потоком, эффективно распределяя вычислительные ресурсы через механизмы динамической маршрутизации. Модель интегрирует множественные текстовые энкодеры, включая OpenCLIP ViT-bigG, OpenAI CLIP ViT-L, T5-XXL и Llama-3.1-8B-Instruct, значительно улучшая возможности семантического понимания.
Результаты бенчмарков
DPG-Bench
Модель | Общий | Глобальный | Сущность | Атрибут | Отношение | Другое |
---|---|---|---|---|---|---|
PixArt-alpha | 71.11 | 74.97 | 79.32 | 78.60 | 82.57 | 76.96 |
SDXL | 74.65 | 83.27 | 82.43 | 80.91 | 86.76 | 80.41 |
DALL-E 3 | 83.50 | 90.97 | 89.61 | 88.39 | 90.58 | 89.83 |
Flux.1-dev | 83.79 | 85.80 | 86.79 | 89.98 | 90.04 | 89.90 |
SD3-Medium | 84.08 | 87.90 | 91.01 | 88.83 | 80.70 | 88.68 |
Janus-Pro-7B | 84.19 | 86.90 | 88.90 | 89.40 | 89.32 | 89.48 |
CogView4-6B | 85.13 | 83.85 | 90.35 | 91.17 | 91.14 | 87.29 |
HiDream-I1 | 85.89 | 76.44 | 90.22 | 89.48 | 93.74 | 91.83 |
GenEval
Модель | Общий | Один объект | Два объекта | Подсчет | Цвета | Позиция | Цветовая атрибуция |
---|---|---|---|---|---|---|---|
SDXL | 0.55 | 0.98 | 0.74 | 0.39 | 0.85 | 0.15 | 0.23 |
PixArt-alpha | 0.48 | 0.98 | 0.50 | 0.44 | 0.80 | 0.08 | 0.07 |
Flux.1-dev | 0.66 | 0.98 | 0.79 | 0.73 | 0.77 | 0.22 | 0.45 |
DALL-E 3 | 0.67 | 0.96 | 0.87 | 0.47 | 0.83 | 0.43 | 0.45 |
CogView4-6B | 0.73 | 0.99 | 0.86 | 0.66 | 0.79 | 0.48 | 0.58 |
SD3-Medium | 0.74 | 0.99 | 0.94 | 0.72 | 0.89 | 0.33 | 0.60 |
Janus-Pro-7B | 0.80 | 0.99 | 0.89 | 0.59 | 0.90 | 0.79 | 0.66 |
HiDream-I1 | 0.83 | 1.00 | 0.98 | 0.79 | 0.91 | 0.60 | 0.72 |
Бенчмарк HPSv2.1
Модель | Среднее | Анимация | Концепт-арт | Живопись | Фото |
---|---|---|---|---|---|
Stable Diffusion v2.0 | 26.38 | 27.09 | 26.02 | 25.68 | 26.73 |
Midjourney V6 | 30.29 | 32.02 | 30.29 | 29.74 | 29.10 |
SDXL | 30.64 | 32.84 | 31.36 | 30.86 | 27.48 |
Dall-E3 | 31.44 | 32.39 | 31.09 | 31.18 | 31.09 |
SD3 | 31.53 | 32.60 | 31.82 | 32.06 | 29.62 |
Midjourney V5 | 32.33 | 34.05 | 32.47 | 32.24 | 30.56 |
CogView4-6B | 32.31 | 33.23 | 32.60 | 32.89 | 30.52 |
Flux.1-dev | 32.47 | 33.87 | 32.27 | 32.62 | 31.11 |
stable cascade | 32.95 | 34.58 | 33.13 | 33.29 | 30.78 |
HiDream-I1 | 33.82 | 35.05 | 33.74 | 33.88 | 32.61 |
Начало работы
Чтобы попробовать использовать модель HiDream-I1, посетите GitHub репозиторий проекта для подробных руководств по установке и использованию: GitHub репозиторий HiDream-I1
Вы также можете скачать веса модели напрямую с Hugging Face, выбрав версию, которая подходит вашим потребностям.
Совет: Использование этой модели требует установки Flash Attention, рекомендуется версия CUDA 12.4. Модель также использует Llama-3.1-8B-Instruct, поэтому убедитесь, что у вас есть адекватное сетевое соединение и место на диске.
Связанные ссылки
- Веб-сайт продукта: https://vivago.ai/
- GitHub репозиторий: https://github.com/HiDream-ai/HiDream-I1
- Репозитории моделей на Hugging Face: