Meituan publica como código abierto LongCat 2.0: modelo MoE de 1.6 billones de parámetros entrenado en ASIC de IA

news

Meituan lanza LongCat 2.0, un modelo de lenguaje MoE de 1.6 billones de parámetros con una ventana de contexto de 1 millón de tokens, entrenado completamente en hardware ASIC de IA. Los pesos del modelo se publicarán próximamente bajo licencia MIT.

El 30 de junio de 2026, Meituan (美团) presentó LongCat 2.0, un modelo de lenguaje masivo de mezcla de expertos con 1.6 billones de parámetros totales y aproximadamente 48 mil millones de parámetros activados por token. El modelo tiene licencia MIT y representa uno de los modelos de pesos abiertos más grandes jamás publicados.

Los pesos del modelo aún no están disponibles: el equipo indica "próximamente" en el repositorio de HuggingFace. Este artículo cubre el anuncio y la arquitectura.

Especificaciones clave

EspecificaciónDetalle
ArquitecturaMixture-of-Experts (MoE)
Parámetros totales1.6 billones
Parámetros activados~48B por token
Ventana de contexto1 millón de tokens (Atención Dispersa LongCat)
Datos de entrenamientoMás de 35 billones de tokens
Hardware de entrenamientoSuperpods de ASIC de IA (no GPU NVIDIA)
LicenciaMIT

Importancia: Entrenamiento en ASIC de IA

Uno de los aspectos más notables de LongCat 2.0 es que tanto el entrenamiento completo como el despliegue a gran escala se construyeron completamente sobre superpods de ASIC de IA: chips aceleradores de IA personalizados en lugar de GPU NVIDIA. El preentrenamiento abarcó millones de horas de acelerador en más de 35 billones de tokens sin retrocesos ni picos de pérdida irrecuperables, demostrando capacidad de entrenamiento a escala fronteriza en hardware alternativo.

Aspectos destacados de la arquitectura

LongCat 2.0 introduce LongCat Sparse Attention (Atención Dispersa LongCat), diseñada para manejar tareas de contexto largo de manera eficiente. El modelo fue entrenado con cientos de miles de millones de tokens de datos de contexto de 1M. Combinado con un post-entrenamiento dedicado, esto le otorga a LongCat 2.0 un rendimiento sólido en tareas de codificación y agente.

Estado

El repositorio de HuggingFace (meituan-longcat/LongCat-2.0) está activo con documentación y especificaciones, pero los pesos del modelo aún no se han publicado. El equipo ha indicado que los pesos se publicarán próximamente.

Enlaces

Meituan publica como código abierto LongCat 2.0: modelo MoE de 1.6 billones de parámetros entrenado en ASIC de IA | ComfyUI Wiki