HiDream-I1开源发布 - 新一代开源图像生成模型

智象未来(HiDream.ai)于2025年4月7日正式开源了其最新文生图模型HiDream-I1。该模型拥有17B参数规模，能够在几秒钟内生成高质量图像，并在多项基准测试中取得了领先成绩。

模型特点

✨ 卓越图像质量 - 支持逼真、卡通、艺术等多种风格图像生成，在HPSv2.1评测中取得SOTA成绩，与人类审美偏好高度一致
🎯 一流提示词遵循能力 - 在GenEval和DPG基准测试中表现优异，超越所有其他开源模型
🔓 完全开源 - 采用MIT许可证发布，支持科学研究和创新应用
💼 商业友好 - 生成的图像可自由用于个人项目、科学研究和商业应用

可用模型版本

智象未来提供了三个版本的HiDream-I1模型，以满足不同场景的需求：

-- |

技术亮点

HiDream-I1采用混合专家架构(MoE)的DiT模型，结合了双流MMDiT block与单流DiT block，通过动态路由机制高效分配计算资源。模型集成了多种文本编码器，包括OpenCLIP ViT-bigG、OpenAI CLIP ViT-L、T5-XXL和Llama-3.1-8B-Instruct，显著提升了语义理解能力。

评测成绩

DPG-Bench

-- |

--
PixArt-alpha
SDXL
DALL-E 3
Flux.1-dev
SD3-Medium
Janus-Pro-7B
CogView4-6B
HiDream-I1

GenEval

-- |

-- | | SDXL | 0.55 | 0.98 | 0.74 | 0.39 | 0.85 | 0.15 | 0.23 | | PixArt-alpha | 0.48 | 0.98 | 0.50 | 0.44 | 0.80 | 0.08 | 0.07 | | Flux.1-dev | 0.66 | 0.98 | 0.79 | 0.73 | 0.77 | 0.22 | 0.45 | | DALL-E 3 | 0.67 | 0.96 | 0.87 | 0.47 | 0.83 | 0.43 | 0.45 | | CogView4-6B | 0.73 | 0.99 | 0.86 | 0.66 | 0.79 | 0.48 | 0.58 | | SD3-Medium | 0.74 | 0.99 | 0.94 | 0.72 | 0.89 | 0.33 | 0.60 | | Janus-Pro-7B | 0.80 | 0.99 | 0.89 | 0.59 | 0.90 | 0.79 | 0.66 | | HiDream-I1 | 0.83 | 1.00 | 0.98 | 0.79 | 0.91 | 0.60 | 0.72 |

HPSv2.1 benchmark

-- |

--
Stable Diffusion v2.0
Midjourney V6
SDXL
Dall-E3
SD3
Midjourney V5
CogView4-6B
Flux.1-dev
stable cascade
HiDream-I1

开始使用

想要尝试使用HiDream-I1模型，请访问项目的GitHub仓库获取详细安装和使用指南： HiDream-I1 GitHub仓库

您也可以直接从Hugging Face下载模型权重文件，根据您的需求选择合适的版本。

提示： 使用该模型需要安装Flash Attention，建议使用CUDA 12.4版本。模型还会使用Llama-3.1-8B-Instruct，请确保您有足够的网络连接和磁盘空间。

HiDream-I1开源发布 - 新一代开源图像生成模型

模型特点

可用模型版本

技术亮点

评测成绩

DPG-Bench

GenEval

HPSv2.1 benchmark

开始使用

相关链接

评论