HiDream-I1: オープンソース画像生成の新時代

HiDream-I1 デモ

HiDream.aiは2025年4月7日に最新のテキスト画像生成モデルHiDream-I1を正式にオープンソース化しました。このモデルは17Bのパラメータを持ち、数秒以内に高品質な画像を生成でき、複数のベンチマークテストで優れたスコアを獲得しています。

モデルの特徴

✨ 優れた画像品質 - 写実的、漫画的、芸術的など様々なスタイルの画像生成をサポートし、HPSv2.1評価でSOTA結果を達成、人間の美的好みと高い一致性
🎯 優れたプロンプト追従能力 - GenEvalとDPGベンチマークで例外的に良い性能を発揮し、他のすべてのオープンソースモデルを上回る
🔓 完全オープンソース - MITライセンスの下で公開され、科学研究や革新的なアプリケーションをサポート
💼 ビジネスフレンドリー - 生成された画像は個人プロジェクト、科学研究、商業アプリケーションに自由に使用可能

利用可能なモデルバージョン

HiDream.aiは異なるニーズに対応するためにHiDream-I1モデルの3つのバージョンを提供しています：

モデル名	推論ステップ	特徴	リポジトリリンク
HiDream-I1-Full	50	完全版、最高品質	🤗 HiDream-I1-Full
HiDream-I1-Dev	28	蒸留版、効率と効果のバランス	🤗 HiDream-I1-Dev
HiDream-I1-Fast	16	高速版、リアルタイム生成ニーズに適合	🤗 HiDream-I1-Fast

技術的ハイライト

HiDream-I1はMixture of Experts (MoE) アーキテクチャのDiTモデルを採用し、デュアルフローMMDiT blockとシングルフローDiT blockを組み合わせ、動的ルーティングメカニズムを通じて計算リソースを効率的に配分します。モデルはOpenCLIP ViT-bigG、OpenAI CLIP ViT-L、T5-XXL、Llama-3.1-8B-Instructなど複数のテキストエンコーダーを統合し、意味理解能力を大幅に向上させています。

ベンチマーク結果

DPG-Bench

モデル	総合	Global	Entity	Attribute	Relation	Other
PixArt-alpha	71.11	74.97	79.32	78.60	82.57	76.96
SDXL	74.65	83.27	82.43	80.91	86.76	80.41
DALL-E 3	83.50	90.97	89.61	88.39	90.58	89.83
Flux.1-dev	83.79	85.80	86.79	89.98	90.04	89.90
SD3-Medium	84.08	87.90	91.01	88.83	80.70	88.68
Janus-Pro-7B	84.19	86.90	88.90	89.40	89.32	89.48
CogView4-6B	85.13	83.85	90.35	91.17	91.14	87.29
HiDream-I1	85.89	76.44	90.22	89.48	93.74	91.83

GenEval

モデル	総合	Single Obj.	Two Obj.	Counting	Colors	Position	Color attribution
SDXL	0.55	0.98	0.74	0.39	0.85	0.15	0.23
PixArt-alpha	0.48	0.98	0.50	0.44	0.80	0.08	0.07
Flux.1-dev	0.66	0.98	0.79	0.73	0.77	0.22	0.45
DALL-E 3	0.67	0.96	0.87	0.47	0.83	0.43	0.45
CogView4-6B	0.73	0.99	0.86	0.66	0.79	0.48	0.58
SD3-Medium	0.74	0.99	0.94	0.72	0.89	0.33	0.60
Janus-Pro-7B	0.80	0.99	0.89	0.59	0.90	0.79	0.66
HiDream-I1	0.83	1.00	0.98	0.79	0.91	0.60	0.72

HPSv2.1 ベンチマーク

モデル	平均	Animation	Concept-art	Painting	Photo
Stable Diffusion v2.0	26.38	27.09	26.02	25.68	26.73
Midjourney V6	30.29	32.02	30.29	29.74	29.10
SDXL	30.64	32.84	31.36	30.86	27.48
Dall-E3	31.44	32.39	31.09	31.18	31.09
SD3	31.53	32.60	31.82	32.06	29.62
Midjourney V5	32.33	34.05	32.47	32.24	30.56
CogView4-6B	32.31	33.23	32.60	32.89	30.52
Flux.1-dev	32.47	33.87	32.27	32.62	31.11
stable cascade	32.95	34.58	33.13	33.29	30.78
HiDream-I1	33.82	35.05	33.74	33.88	32.61

使い始める

HiDream-I1モデルを試すには、プロジェクトのGitHubリポジトリにアクセスして詳細なインストールと使用ガイドを参照してください： HiDream-I1 GitHubリポジトリ

また、Hugging Faceから直接モデルの重みをダウンロードすることもでき、ニーズに合ったバージョンを選択できます。

ヒント： このモデルを使用するにはFlash Attentionのインストールが必要で、CUDA 12.4バージョンが推奨されます。また、Llama-3.1-8B-Instructを使用するため、十分なネットワーク接続とディスク容量があることを確認してください。

RunComfy

Comfy Deploy

Comfy Online

Comfy.ICU

InstaSD

ComfyUIがサブグラフ機能を正式リリース