字节跳动推出Seaweed-7B:高性价比的视频生成基础模型
2025/04/14
HiDream-I1: 开创开源图像生成新纪元
智象未来(HiDream.ai)于2025年4月7日正式开源了其最新文生图模型HiDream-I1。该模型拥有17B参数规模,能够在几秒钟内生成高质量图像,并在多项基准测试中取得了领先成绩。
模型特点
- ✨ 卓越图像质量 - 支持逼真、卡通、艺术等多种风格图像生成,在HPSv2.1评测中取得SOTA成绩,与人类审美偏好高度一致
- 🎯 一流提示词遵循能力 - 在GenEval和DPG基准测试中表现优异,超越所有其他开源模型
- 🔓 完全开源 - 采用MIT许可证发布,支持科学研究和创新应用
- 💼 商业友好 - 生成的图像可自由用于个人项目、科学研究和商业应用
可用模型版本
智象未来提供了三个版本的HiDream-I1模型,以满足不同场景的需求:
模型名称 | 推理步数 | 特点 | 仓库链接 |
---|---|---|---|
HiDream-I1-Full | 50 | 完整版,质量最优 | 🤗 HiDream-I1-Full |
HiDream-I1-Dev | 28 | 蒸馏版,平衡效率与效果 | 🤗 HiDream-I1-Dev |
HiDream-I1-Fast | 16 | 极速版,适合实时生成需求 | 🤗 HiDream-I1-Fast |
技术亮点
HiDream-I1采用混合专家架构(MoE)的DiT模型,结合了双流MMDiT block与单流DiT block,通过动态路由机制高效分配计算资源。模型集成了多种文本编码器,包括OpenCLIP ViT-bigG、OpenAI CLIP ViT-L、T5-XXL和Llama-3.1-8B-Instruct,显著提升了语义理解能力。
评测成绩
DPG-Bench
模型 | 总体分数 | Global | Entity | Attribute | Relation | Other |
---|---|---|---|---|---|---|
PixArt-alpha | 71.11 | 74.97 | 79.32 | 78.60 | 82.57 | 76.96 |
SDXL | 74.65 | 83.27 | 82.43 | 80.91 | 86.76 | 80.41 |
DALL-E 3 | 83.50 | 90.97 | 89.61 | 88.39 | 90.58 | 89.83 |
Flux.1-dev | 83.79 | 85.80 | 86.79 | 89.98 | 90.04 | 89.90 |
SD3-Medium | 84.08 | 87.90 | 91.01 | 88.83 | 80.70 | 88.68 |
Janus-Pro-7B | 84.19 | 86.90 | 88.90 | 89.40 | 89.32 | 89.48 |
CogView4-6B | 85.13 | 83.85 | 90.35 | 91.17 | 91.14 | 87.29 |
HiDream-I1 | 85.89 | 76.44 | 90.22 | 89.48 | 93.74 | 91.83 |
GenEval
模型 | 总体分数 | Single Obj. | Two Obj. | Counting | Colors | Position | Color attribution |
---|---|---|---|---|---|---|---|
SDXL | 0.55 | 0.98 | 0.74 | 0.39 | 0.85 | 0.15 | 0.23 |
PixArt-alpha | 0.48 | 0.98 | 0.50 | 0.44 | 0.80 | 0.08 | 0.07 |
Flux.1-dev | 0.66 | 0.98 | 0.79 | 0.73 | 0.77 | 0.22 | 0.45 |
DALL-E 3 | 0.67 | 0.96 | 0.87 | 0.47 | 0.83 | 0.43 | 0.45 |
CogView4-6B | 0.73 | 0.99 | 0.86 | 0.66 | 0.79 | 0.48 | 0.58 |
SD3-Medium | 0.74 | 0.99 | 0.94 | 0.72 | 0.89 | 0.33 | 0.60 |
Janus-Pro-7B | 0.80 | 0.99 | 0.89 | 0.59 | 0.90 | 0.79 | 0.66 |
HiDream-I1 | 0.83 | 1.00 | 0.98 | 0.79 | 0.91 | 0.60 | 0.72 |
HPSv2.1 benchmark
模型 | 平均分 | Animation | Concept-art | Painting | Photo |
---|---|---|---|---|---|
Stable Diffusion v2.0 | 26.38 | 27.09 | 26.02 | 25.68 | 26.73 |
Midjourney V6 | 30.29 | 32.02 | 30.29 | 29.74 | 29.10 |
SDXL | 30.64 | 32.84 | 31.36 | 30.86 | 27.48 |
Dall-E3 | 31.44 | 32.39 | 31.09 | 31.18 | 31.09 |
SD3 | 31.53 | 32.60 | 31.82 | 32.06 | 29.62 |
Midjourney V5 | 32.33 | 34.05 | 32.47 | 32.24 | 30.56 |
CogView4-6B | 32.31 | 33.23 | 32.60 | 32.89 | 30.52 |
Flux.1-dev | 32.47 | 33.87 | 32.27 | 32.62 | 31.11 |
stable cascade | 32.95 | 34.58 | 33.13 | 33.29 | 30.78 |
HiDream-I1 | 33.82 | 35.05 | 33.74 | 33.88 | 32.61 |
开始使用
想要尝试使用HiDream-I1模型,请访问项目的GitHub仓库获取详细安装和使用指南: HiDream-I1 GitHub仓库
您也可以直接从Hugging Face下载模型权重文件,根据您的需求选择合适的版本。
提示: 使用该模型需要安装Flash Attention,建议使用CUDA 12.4版本。模型还会使用Llama-3.1-8B-Instruct,请确保您有足够的网络连接和磁盘空间。
相关链接
- 产品官网:https://vivago.ai/
- GitHub仓库:https://github.com/HiDream-ai/HiDream-I1
- Hugging Face模型仓库: