HiDream-I1: Новая эра в генерации изображений с открытым исходным кодом

Демо HiDream-I1

HiDream.ai официально открыл исходный код своей последней модели генерации изображений из текста HiDream-I1 7 апреля 2025 года. С 17B параметрами эта модель может генерировать высококачественные изображения за секунды и достигла ведущих результатов в множественных тестах бенчмарков.

Особенности модели

✨ Превосходное качество изображений - Поддерживает реалистичные, мультипликационные, художественные и различные другие стили изображений, достигая результатов SOTA в оценке HPSv2.1, высоко согласованных с человеческими эстетическими предпочтениями
🎯 Отличное следование промптам - Показывает исключительно хорошие результаты в бенчмарках GenEval и DPG, превосходя все другие модели с открытым исходным кодом
🔓 Полностью открытый исходный код - Выпущена под лицензией MIT, поддерживая научные исследования и инновационные приложения
💼 Дружественная к бизнесу - Сгенерированные изображения могут свободно использоваться для личных проектов, научных исследований и коммерческих приложений

Доступные версии модели

HiDream.ai предлагает три версии модели HiDream-I1 для удовлетворения различных потребностей:

Название модели	Шаги вывода	Особенности	Ссылка на репозиторий
HiDream-I1-Full	50	Полная версия, лучшее качество	🤗 HiDream-I1-Full
HiDream-I1-Dev	28	Дистиллированная версия, баланс эффективности и результативности	🤗 HiDream-I1-Dev
HiDream-I1-Fast	16	Быстрая версия, подходящая для потребностей генерации в реальном времени	🤗 HiDream-I1-Fast

Технические особенности

HiDream-I1 использует архитектуру DiT модели Mixture of Experts (MoE), комбинируя блоки MMDiT с двойным потоком с блоками DiT с одинарным потоком, эффективно распределяя вычислительные ресурсы через механизмы динамической маршрутизации. Модель интегрирует множественные текстовые энкодеры, включая OpenCLIP ViT-bigG, OpenAI CLIP ViT-L, T5-XXL и Llama-3.1-8B-Instruct, значительно улучшая возможности семантического понимания.

Результаты бенчмарков

DPG-Bench

Модель	Общий	Глобальный	Сущность	Атрибут	Отношение	Другое
PixArt-alpha	71.11	74.97	79.32	78.60	82.57	76.96
SDXL	74.65	83.27	82.43	80.91	86.76	80.41
DALL-E 3	83.50	90.97	89.61	88.39	90.58	89.83
Flux.1-dev	83.79	85.80	86.79	89.98	90.04	89.90
SD3-Medium	84.08	87.90	91.01	88.83	80.70	88.68
Janus-Pro-7B	84.19	86.90	88.90	89.40	89.32	89.48
CogView4-6B	85.13	83.85	90.35	91.17	91.14	87.29
HiDream-I1	85.89	76.44	90.22	89.48	93.74	91.83

GenEval

Модель	Общий	Один объект	Два объекта	Подсчет	Цвета	Позиция	Цветовая атрибуция
SDXL	0.55	0.98	0.74	0.39	0.85	0.15	0.23
PixArt-alpha	0.48	0.98	0.50	0.44	0.80	0.08	0.07
Flux.1-dev	0.66	0.98	0.79	0.73	0.77	0.22	0.45
DALL-E 3	0.67	0.96	0.87	0.47	0.83	0.43	0.45
CogView4-6B	0.73	0.99	0.86	0.66	0.79	0.48	0.58
SD3-Medium	0.74	0.99	0.94	0.72	0.89	0.33	0.60
Janus-Pro-7B	0.80	0.99	0.89	0.59	0.90	0.79	0.66
HiDream-I1	0.83	1.00	0.98	0.79	0.91	0.60	0.72

Бенчмарк HPSv2.1

Модель	Среднее	Анимация	Концепт-арт	Живопись	Фото
Stable Diffusion v2.0	26.38	27.09	26.02	25.68	26.73
Midjourney V6	30.29	32.02	30.29	29.74	29.10
SDXL	30.64	32.84	31.36	30.86	27.48
Dall-E3	31.44	32.39	31.09	31.18	31.09
SD3	31.53	32.60	31.82	32.06	29.62
Midjourney V5	32.33	34.05	32.47	32.24	30.56
CogView4-6B	32.31	33.23	32.60	32.89	30.52
Flux.1-dev	32.47	33.87	32.27	32.62	31.11
stable cascade	32.95	34.58	33.13	33.29	30.78
HiDream-I1	33.82	35.05	33.74	33.88	32.61

Начало работы

Чтобы попробовать использовать модель HiDream-I1, посетите GitHub репозиторий проекта для подробных руководств по установке и использованию: GitHub репозиторий HiDream-I1

Вы также можете скачать веса модели напрямую с Hugging Face, выбрав версию, которая подходит вашим потребностям.

Совет: Использование этой модели требует установки Flash Attention, рекомендуется версия CUDA 12.4. Модель также использует Llama-3.1-8B-Instruct, поэтому убедитесь, что у вас есть адекватное сетевое соединение и место на диске.

Связанные ссылки

Веб-сайт продукта: https://vivago.ai/
GitHub репозиторий: https://github.com/HiDream-ai/HiDream-I1
Репозитории моделей на Hugging Face: