Skip to content
より良い ComfyUI ナレッジベースの構築を支援する サポーターになる
ニュースHiDream-I1オープンソースリリース - 次世代画像生成モデル

HiDream-I1: オープンソース画像生成の新時代

HiDream-I1 デモ

HiDream.aiは2025年4月7日に最新のテキスト画像生成モデルHiDream-I1を正式にオープンソース化しました。このモデルは17Bのパラメータを持ち、数秒以内に高品質な画像を生成でき、複数のベンチマークテストで優れたスコアを獲得しています。

モデルの特徴

  • 優れた画像品質 - 写実的、漫画的、芸術的など様々なスタイルの画像生成をサポートし、HPSv2.1評価でSOTA結果を達成、人間の美的好みと高い一致性
  • 🎯 優れたプロンプト追従能力 - GenEvalとDPGベンチマークで例外的に良い性能を発揮し、他のすべてのオープンソースモデルを上回る
  • 🔓 完全オープンソース - MITライセンスの下で公開され、科学研究や革新的なアプリケーションをサポート
  • 💼 ビジネスフレンドリー - 生成された画像は個人プロジェクト、科学研究、商業アプリケーションに自由に使用可能

利用可能なモデルバージョン

HiDream.aiは異なるニーズに対応するためにHiDream-I1モデルの3つのバージョンを提供しています:

モデル名推論ステップ特徴リポジトリリンク
HiDream-I1-Full50完全版、最高品質🤗 HiDream-I1-Full
HiDream-I1-Dev28蒸留版、効率と効果のバランス🤗 HiDream-I1-Dev
HiDream-I1-Fast16高速版、リアルタイム生成ニーズに適合🤗 HiDream-I1-Fast

技術的ハイライト

HiDream-I1はMixture of Experts (MoE) アーキテクチャのDiTモデルを採用し、デュアルフローMMDiT blockとシングルフローDiT blockを組み合わせ、動的ルーティングメカニズムを通じて計算リソースを効率的に配分します。モデルはOpenCLIP ViT-bigG、OpenAI CLIP ViT-L、T5-XXL、Llama-3.1-8B-Instructなど複数のテキストエンコーダーを統合し、意味理解能力を大幅に向上させています。

ベンチマーク結果

DPG-Bench

モデル総合GlobalEntityAttributeRelationOther
PixArt-alpha71.1174.9779.3278.6082.5776.96
SDXL74.6583.2782.4380.9186.7680.41
DALL-E 383.5090.9789.6188.3990.5889.83
Flux.1-dev83.7985.8086.7989.9890.0489.90
SD3-Medium84.0887.9091.0188.8380.7088.68
Janus-Pro-7B84.1986.9088.9089.4089.3289.48
CogView4-6B85.1383.8590.3591.1791.1487.29
HiDream-I185.8976.4490.2289.4893.7491.83

GenEval

モデル総合Single Obj.Two Obj.CountingColorsPositionColor attribution
SDXL0.550.980.740.390.850.150.23
PixArt-alpha0.480.980.500.440.800.080.07
Flux.1-dev0.660.980.790.730.770.220.45
DALL-E 30.670.960.870.470.830.430.45
CogView4-6B0.730.990.860.660.790.480.58
SD3-Medium0.740.990.940.720.890.330.60
Janus-Pro-7B0.800.990.890.590.900.790.66
HiDream-I10.831.000.980.790.910.600.72

HPSv2.1 ベンチマーク

モデル平均AnimationConcept-artPaintingPhoto
Stable Diffusion v2.026.3827.0926.0225.6826.73
Midjourney V630.2932.0230.2929.7429.10
SDXL30.6432.8431.3630.8627.48
Dall-E331.4432.3931.0931.1831.09
SD331.5332.6031.8232.0629.62
Midjourney V532.3334.0532.4732.2430.56
CogView4-6B32.3133.2332.6032.8930.52
Flux.1-dev32.4733.8732.2732.6231.11
stable cascade32.9534.5833.1333.2930.78
HiDream-I133.8235.0533.7433.8832.61

使い始める

HiDream-I1モデルを試すには、プロジェクトのGitHubリポジトリにアクセスして詳細なインストールと使用ガイドを参照してください: HiDream-I1 GitHubリポジトリ

また、Hugging Faceから直接モデルの重みをダウンロードすることもでき、ニーズに合ったバージョンを選択できます。

ヒント: このモデルを使用するにはFlash Attentionのインストールが必要で、CUDA 12.4バージョンが推奨されます。また、Llama-3.1-8B-Instructを使用するため、十分なネットワーク接続とディスク容量があることを確認してください。

関連リンク