Skip to content
Aidez à Construire une Meilleure Base de Connaissances ComfyUI Devenir Parrain
ActualitésPublication open source de HiDream-I1 - Modèle de génération d'images de nouvelle génération
Aucun article pour le moment. Revenez plus tard !

HiDream-I1 : Nouvelle ère dans la génération d’images open source

Démo HiDream-I1

HiDream.ai a officiellement publié en open source son dernier modèle texte-image HiDream-I1 le 7 avril 2025. Avec 17 milliards de paramètres, ce modèle peut générer des images de haute qualité en quelques secondes et a obtenu des scores de premier plan dans plusieurs tests de référence.

Caractéristiques du modèle

  • Qualité d’image supérieure - Prend en charge les styles réalistes, de dessins animés, artistiques et divers autres styles, atteignant des résultats SOTA dans l’évaluation HPSv2.1, hautement alignés avec les préférences esthétiques humaines
  • 🎯 Excellente réponse aux instructions - Performances exceptionnelles dans les benchmarks GenEval et DPG, surpassant tous les autres modèles open source
  • 🔓 Entièrement open source - Publié sous licence MIT, soutenant la recherche scientifique et les applications innovantes
  • 💼 Compatible avec les entreprises - Les images générées peuvent être librement utilisées pour des projets personnels, la recherche scientifique et les applications commerciales

Versions disponibles du modèle

HiDream.ai propose trois versions du modèle HiDream-I1 pour répondre à différents besoins :

Nom du modèleÉtapes d’inférenceCaractéristiquesLien vers le dépôt
HiDream-I1-Full50Version complète, meilleure qualité🤗 HiDream-I1-Full
HiDream-I1-Dev28Version distillée, équilibre entre efficacité et efficacité🤗 HiDream-I1-Dev
HiDream-I1-Fast16Version rapide, adaptée aux besoins de génération en temps réel🤗 HiDream-I1-Fast

Points forts techniques

HiDream-I1 utilise un modèle DiT avec architecture Mixture of Experts (MoE), combinant des blocs MMDiT à double flux avec des blocs DiT à flux unique, allouant efficacement les ressources de calcul grâce à des mécanismes de routage dynamique. Le modèle intègre plusieurs encodeurs de texte, notamment OpenCLIP ViT-bigG, OpenAI CLIP ViT-L, T5-XXL et Llama-3.1-8B-Instruct, améliorant considérablement les capacités de compréhension sémantique.

Résultats des benchmarks

DPG-Bench

ModèleGlobalGlobalEntityAttributeRelationOther
PixArt-alpha71.1174.9779.3278.6082.5776.96
SDXL74.6583.2782.4380.9186.7680.41
DALL-E 383.5090.9789.6188.3990.5889.83
Flux.1-dev83.7985.8086.7989.9890.0489.90
SD3-Medium84.0887.9091.0188.8380.7088.68
Janus-Pro-7B84.1986.9088.9089.4089.3289.48
CogView4-6B85.1383.8590.3591.1791.1487.29
HiDream-I185.8976.4490.2289.4893.7491.83

GenEval

ModèleGlobalSingle Obj.Two Obj.CountingColorsPositionColor attribution
SDXL0.550.980.740.390.850.150.23
PixArt-alpha0.480.980.500.440.800.080.07
Flux.1-dev0.660.980.790.730.770.220.45
DALL-E 30.670.960.870.470.830.430.45
CogView4-6B0.730.990.860.660.790.480.58
SD3-Medium0.740.990.940.720.890.330.60
Janus-Pro-7B0.800.990.890.590.900.790.66
HiDream-I10.831.000.980.790.910.600.72

Benchmark HPSv2.1

ModèleMoyenneAnimationConcept-artPaintingPhoto
Stable Diffusion v2.026.3827.0926.0225.6826.73
Midjourney V630.2932.0230.2929.7429.10
SDXL30.6432.8431.3630.8627.48
Dall-E331.4432.3931.0931.1831.09
SD331.5332.6031.8232.0629.62
Midjourney V532.3334.0532.4732.2430.56
CogView4-6B32.3133.2332.6032.8930.52
Flux.1-dev32.4733.8732.2732.6231.11
stable cascade32.9534.5833.1333.2930.78
HiDream-I133.8235.0533.7433.8832.61

Démarrage

Pour essayer le modèle HiDream-I1, visitez le dépôt GitHub du projet pour des guides détaillés d’installation et d’utilisation : Dépôt GitHub HiDream-I1

Vous pouvez également télécharger directement les poids du modèle depuis Hugging Face, en choisissant la version qui convient à vos besoins.

Conseil : L’utilisation de ce modèle nécessite l’installation de Flash Attention, avec la version CUDA 12.4 recommandée. Le modèle utilise également Llama-3.1-8B-Instruct, alors assurez-vous d’avoir une connexion réseau et un espace disque adéquats.

Liens connexes