Skip to content
ComfyUI Wiki
Помогите создать лучшую базу знаний ComfyUI Стать спонсором
НовостиHiDream-I1 - Выпуск с открытым исходным кодом - Модель генерации изображений следующего поколения

HiDream-I1: Новая эра в генерации изображений с открытым исходным кодом

Демо HiDream-I1

HiDream.ai официально открыл исходный код своей последней модели генерации изображений из текста HiDream-I1 7 апреля 2025 года. С 17B параметрами эта модель может генерировать высококачественные изображения за секунды и достигла ведущих результатов в множественных тестах бенчмарков.

Особенности модели

  • Превосходное качество изображений - Поддерживает реалистичные, мультипликационные, художественные и различные другие стили изображений, достигая результатов SOTA в оценке HPSv2.1, высоко согласованных с человеческими эстетическими предпочтениями
  • 🎯 Отличное следование промптам - Показывает исключительно хорошие результаты в бенчмарках GenEval и DPG, превосходя все другие модели с открытым исходным кодом
  • 🔓 Полностью открытый исходный код - Выпущена под лицензией MIT, поддерживая научные исследования и инновационные приложения
  • 💼 Дружественная к бизнесу - Сгенерированные изображения могут свободно использоваться для личных проектов, научных исследований и коммерческих приложений

Доступные версии модели

HiDream.ai предлагает три версии модели HiDream-I1 для удовлетворения различных потребностей:

Название моделиШаги выводаОсобенностиСсылка на репозиторий
HiDream-I1-Full50Полная версия, лучшее качество🤗 HiDream-I1-Full
HiDream-I1-Dev28Дистиллированная версия, баланс эффективности и результативности🤗 HiDream-I1-Dev
HiDream-I1-Fast16Быстрая версия, подходящая для потребностей генерации в реальном времени🤗 HiDream-I1-Fast

Технические особенности

HiDream-I1 использует архитектуру DiT модели Mixture of Experts (MoE), комбинируя блоки MMDiT с двойным потоком с блоками DiT с одинарным потоком, эффективно распределяя вычислительные ресурсы через механизмы динамической маршрутизации. Модель интегрирует множественные текстовые энкодеры, включая OpenCLIP ViT-bigG, OpenAI CLIP ViT-L, T5-XXL и Llama-3.1-8B-Instruct, значительно улучшая возможности семантического понимания.

Результаты бенчмарков

DPG-Bench

МодельОбщийГлобальныйСущностьАтрибутОтношениеДругое
PixArt-alpha71.1174.9779.3278.6082.5776.96
SDXL74.6583.2782.4380.9186.7680.41
DALL-E 383.5090.9789.6188.3990.5889.83
Flux.1-dev83.7985.8086.7989.9890.0489.90
SD3-Medium84.0887.9091.0188.8380.7088.68
Janus-Pro-7B84.1986.9088.9089.4089.3289.48
CogView4-6B85.1383.8590.3591.1791.1487.29
HiDream-I185.8976.4490.2289.4893.7491.83

GenEval

МодельОбщийОдин объектДва объектаПодсчетЦветаПозицияЦветовая атрибуция
SDXL0.550.980.740.390.850.150.23
PixArt-alpha0.480.980.500.440.800.080.07
Flux.1-dev0.660.980.790.730.770.220.45
DALL-E 30.670.960.870.470.830.430.45
CogView4-6B0.730.990.860.660.790.480.58
SD3-Medium0.740.990.940.720.890.330.60
Janus-Pro-7B0.800.990.890.590.900.790.66
HiDream-I10.831.000.980.790.910.600.72

Бенчмарк HPSv2.1

МодельСреднееАнимацияКонцепт-артЖивописьФото
Stable Diffusion v2.026.3827.0926.0225.6826.73
Midjourney V630.2932.0230.2929.7429.10
SDXL30.6432.8431.3630.8627.48
Dall-E331.4432.3931.0931.1831.09
SD331.5332.6031.8232.0629.62
Midjourney V532.3334.0532.4732.2430.56
CogView4-6B32.3133.2332.6032.8930.52
Flux.1-dev32.4733.8732.2732.6231.11
stable cascade32.9534.5833.1333.2930.78
HiDream-I133.8235.0533.7433.8832.61

Начало работы

Чтобы попробовать использовать модель HiDream-I1, посетите GitHub репозиторий проекта для подробных руководств по установке и использованию: GitHub репозиторий HiDream-I1

Вы также можете скачать веса модели напрямую с Hugging Face, выбрав версию, которая подходит вашим потребностям.

Совет: Использование этой модели требует установки Flash Attention, рекомендуется версия CUDA 12.4. Модель также использует Llama-3.1-8B-Instruct, поэтому убедитесь, что у вас есть адекватное сетевое соединение и место на диске.

Связанные ссылки