HiDream-I1: オープンソース画像生成の新時代
HiDream.aiは2025年4月7日に最新のテキスト画像生成モデルHiDream-I1を正式にオープンソース化しました。このモデルは17Bのパラメータを持ち、数秒以内に高品質な画像を生成でき、複数のベンチマークテストで優れたスコアを獲得しています。
モデルの特徴
- ✨ 優れた画像品質 - 写実的、漫画的、芸術的など様々なスタイルの画像生成をサポートし、HPSv2.1評価でSOTA結果を達成、人間の美的好みと高い一致性
- 🎯 優れたプロンプト追従能力 - GenEvalとDPGベンチマークで例外的に良い性能を発揮し、他のすべてのオープンソースモデルを上回る
- 🔓 完全オープンソース - MITライセンスの下で公開され、科学研究や革新的なアプリケーションをサポート
- 💼 ビジネスフレンドリー - 生成された画像は個人プロジェクト、科学研究、商業アプリケーションに自由に使用可能
利用可能なモデルバージョン
HiDream.aiは異なるニーズに対応するためにHiDream-I1モデルの3つのバージョンを提供しています:
モデル名 | 推論ステップ | 特徴 | リポジトリリンク |
---|---|---|---|
HiDream-I1-Full | 50 | 完全版、最高品質 | 🤗 HiDream-I1-Full |
HiDream-I1-Dev | 28 | 蒸留版、効率と効果のバランス | 🤗 HiDream-I1-Dev |
HiDream-I1-Fast | 16 | 高速版、リアルタイム生成ニーズに適合 | 🤗 HiDream-I1-Fast |
技術的ハイライト
HiDream-I1はMixture of Experts (MoE) アーキテクチャのDiTモデルを採用し、デュアルフローMMDiT blockとシングルフローDiT blockを組み合わせ、動的ルーティングメカニズムを通じて計算リソースを効率的に配分します。モデルはOpenCLIP ViT-bigG、OpenAI CLIP ViT-L、T5-XXL、Llama-3.1-8B-Instructなど複数のテキストエンコーダーを統合し、意味理解能力を大幅に向上させています。
ベンチマーク結果
DPG-Bench
モデル | 総合 | Global | Entity | Attribute | Relation | Other |
---|---|---|---|---|---|---|
PixArt-alpha | 71.11 | 74.97 | 79.32 | 78.60 | 82.57 | 76.96 |
SDXL | 74.65 | 83.27 | 82.43 | 80.91 | 86.76 | 80.41 |
DALL-E 3 | 83.50 | 90.97 | 89.61 | 88.39 | 90.58 | 89.83 |
Flux.1-dev | 83.79 | 85.80 | 86.79 | 89.98 | 90.04 | 89.90 |
SD3-Medium | 84.08 | 87.90 | 91.01 | 88.83 | 80.70 | 88.68 |
Janus-Pro-7B | 84.19 | 86.90 | 88.90 | 89.40 | 89.32 | 89.48 |
CogView4-6B | 85.13 | 83.85 | 90.35 | 91.17 | 91.14 | 87.29 |
HiDream-I1 | 85.89 | 76.44 | 90.22 | 89.48 | 93.74 | 91.83 |
GenEval
モデル | 総合 | Single Obj. | Two Obj. | Counting | Colors | Position | Color attribution |
---|---|---|---|---|---|---|---|
SDXL | 0.55 | 0.98 | 0.74 | 0.39 | 0.85 | 0.15 | 0.23 |
PixArt-alpha | 0.48 | 0.98 | 0.50 | 0.44 | 0.80 | 0.08 | 0.07 |
Flux.1-dev | 0.66 | 0.98 | 0.79 | 0.73 | 0.77 | 0.22 | 0.45 |
DALL-E 3 | 0.67 | 0.96 | 0.87 | 0.47 | 0.83 | 0.43 | 0.45 |
CogView4-6B | 0.73 | 0.99 | 0.86 | 0.66 | 0.79 | 0.48 | 0.58 |
SD3-Medium | 0.74 | 0.99 | 0.94 | 0.72 | 0.89 | 0.33 | 0.60 |
Janus-Pro-7B | 0.80 | 0.99 | 0.89 | 0.59 | 0.90 | 0.79 | 0.66 |
HiDream-I1 | 0.83 | 1.00 | 0.98 | 0.79 | 0.91 | 0.60 | 0.72 |
HPSv2.1 ベンチマーク
モデル | 平均 | Animation | Concept-art | Painting | Photo |
---|---|---|---|---|---|
Stable Diffusion v2.0 | 26.38 | 27.09 | 26.02 | 25.68 | 26.73 |
Midjourney V6 | 30.29 | 32.02 | 30.29 | 29.74 | 29.10 |
SDXL | 30.64 | 32.84 | 31.36 | 30.86 | 27.48 |
Dall-E3 | 31.44 | 32.39 | 31.09 | 31.18 | 31.09 |
SD3 | 31.53 | 32.60 | 31.82 | 32.06 | 29.62 |
Midjourney V5 | 32.33 | 34.05 | 32.47 | 32.24 | 30.56 |
CogView4-6B | 32.31 | 33.23 | 32.60 | 32.89 | 30.52 |
Flux.1-dev | 32.47 | 33.87 | 32.27 | 32.62 | 31.11 |
stable cascade | 32.95 | 34.58 | 33.13 | 33.29 | 30.78 |
HiDream-I1 | 33.82 | 35.05 | 33.74 | 33.88 | 32.61 |
使い始める
HiDream-I1モデルを試すには、プロジェクトのGitHubリポジトリにアクセスして詳細なインストールと使用ガイドを参照してください: HiDream-I1 GitHubリポジトリ
また、Hugging Faceから直接モデルの重みをダウンロードすることもでき、ニーズに合ったバージョンを選択できます。
ヒント: このモデルを使用するにはFlash Attentionのインストールが必要で、CUDA 12.4バージョンが推奨されます。また、Llama-3.1-8B-Instructを使用するため、十分なネットワーク接続とディスク容量があることを確認してください。
関連リンク
- 製品ウェブサイト:https://vivago.ai/
- GitHubリポジトリ:https://github.com/HiDream-ai/HiDream-I1
- Hugging Faceモデルリポジトリ: