Skip to content
Ayuda a Construir una Mejor Base de Conocimientos de ComfyUI Conviértete en Patrocinador
NoticiasLanzamiento de código abierto HiDream-I1 - Modelo de generación de imágenes de nueva generación

HiDream-I1: Nueva era en la generación de imágenes de código abierto

Demo de HiDream-I1

HiDream.ai lanzó oficialmente como código abierto su último modelo de texto a imagen HiDream-I1 el 7 de abril de 2025. Con 17B parámetros, este modelo puede generar imágenes de alta calidad en segundos y ha logrado puntuaciones líderes en múltiples pruebas de referencia.

Características del modelo

  • Calidad de imagen superior - Compatible con estilos realistas, caricaturas, artísticos y otros variados, alcanzando resultados SOTA en la evaluación HPSv2.1, altamente alineado con las preferencias estéticas humanas
  • 🎯 Excelente seguimiento de indicaciones - Rinde excepcionalmente bien en las pruebas GenEval y DPG, superando a todos los demás modelos de código abierto
  • 🔓 Totalmente de código abierto - Publicado bajo licencia MIT, apoyando la investigación científica y aplicaciones innovadoras
  • 💼 Compatible con negocios - Las imágenes generadas pueden usarse libremente para proyectos personales, investigación científica y aplicaciones comerciales

Versiones disponibles del modelo

HiDream.ai ofrece tres versiones del modelo HiDream-I1 para satisfacer diferentes necesidades:

Nombre del modeloPasos de inferenciaCaracterísticasEnlace al repositorio
HiDream-I1-Full50Versión completa, mejor calidad🤗 HiDream-I1-Full
HiDream-I1-Dev28Versión destilada, equilibrio entre eficiencia y efectividad🤗 HiDream-I1-Dev
HiDream-I1-Fast16Versión rápida, adecuada para necesidades de generación en tiempo real🤗 HiDream-I1-Fast

Aspectos técnicos destacados

HiDream-I1 emplea un modelo DiT con arquitectura de Mezcla de Expertos (MoE), combinando bloques MMDiT de flujo dual con bloques DiT de flujo único, asignando eficientemente recursos de cómputo mediante mecanismos de enrutamiento dinámico. El modelo integra múltiples codificadores de texto, incluyendo OpenCLIP ViT-bigG, OpenAI CLIP ViT-L, T5-XXL y Llama-3.1-8B-Instruct, mejorando significativamente las capacidades de comprensión semántica.

Resultados de referencia

DPG-Bench

ModeloGeneralGlobalEntityAttributeRelationOther
PixArt-alpha71.1174.9779.3278.6082.5776.96
SDXL74.6583.2782.4380.9186.7680.41
DALL-E 383.5090.9789.6188.3990.5889.83
Flux.1-dev83.7985.8086.7989.9890.0489.90
SD3-Medium84.0887.9091.0188.8380.7088.68
Janus-Pro-7B84.1986.9088.9089.4089.3289.48
CogView4-6B85.1383.8590.3591.1791.1487.29
HiDream-I185.8976.4490.2289.4893.7491.83

GenEval

ModeloGeneralSingle Obj.Two Obj.CountingColorsPositionColor attribution
SDXL0.550.980.740.390.850.150.23
PixArt-alpha0.480.980.500.440.800.080.07
Flux.1-dev0.660.980.790.730.770.220.45
DALL-E 30.670.960.870.470.830.430.45
CogView4-6B0.730.990.860.660.790.480.58
SD3-Medium0.740.990.940.720.890.330.60
Janus-Pro-7B0.800.990.890.590.900.790.66
HiDream-I10.831.000.980.790.910.600.72

HPSv2.1 benchmark

ModeloPromedioAnimationConcept-artPaintingPhoto
Stable Diffusion v2.026.3827.0926.0225.6826.73
Midjourney V630.2932.0230.2929.7429.10
SDXL30.6432.8431.3630.8627.48
Dall-E331.4432.3931.0931.1831.09
SD331.5332.6031.8232.0629.62
Midjourney V532.3334.0532.4732.2430.56
CogView4-6B32.3133.2332.6032.8930.52
Flux.1-dev32.4733.8732.2732.6231.11
stable cascade32.9534.5833.1333.2930.78
HiDream-I133.8235.0533.7433.8832.61

Primeros pasos

Para probar el modelo HiDream-I1, visite el repositorio GitHub del proyecto para obtener guías detalladas de instalación y uso: Repositorio GitHub de HiDream-I1

También puede descargar los pesos del modelo directamente desde Hugging Face, eligiendo la versión que se adapte a sus necesidades.

Consejo: El uso de este modelo requiere la instalación de Flash Attention, recomendándose la versión CUDA 12.4. El modelo también utiliza Llama-3.1-8B-Instruct, así que asegúrese de tener una conexión de red y espacio en disco adecuados.

Enlaces relacionados