Meituan publica como código abierto LongCat 2.0: modelo MoE de 1.6 billones de parámetros entrenado en ASIC de IA

El 30 de junio de 2026, Meituan (美团) presentó LongCat 2.0, un modelo de lenguaje masivo de mezcla de expertos con 1.6 billones de parámetros totales y aproximadamente 48 mil millones de parámetros activados por token. El modelo tiene licencia MIT y representa uno de los modelos de pesos abiertos más grandes jamás publicados.

Los pesos del modelo aún no están disponibles: el equipo indica "próximamente" en el repositorio de HuggingFace. Este artículo cubre el anuncio y la arquitectura.

Especificaciones clave

Especificación	Detalle
Arquitectura	Mixture-of-Experts (MoE)
Parámetros totales	1.6 billones
Parámetros activados	~48B por token
Ventana de contexto	1 millón de tokens (Atención Dispersa LongCat)
Datos de entrenamiento	Más de 35 billones de tokens
Hardware de entrenamiento	Superpods de ASIC de IA (no GPU NVIDIA)
Licencia	MIT

Importancia: Entrenamiento en ASIC de IA

Uno de los aspectos más notables de LongCat 2.0 es que tanto el entrenamiento completo como el despliegue a gran escala se construyeron completamente sobre superpods de ASIC de IA: chips aceleradores de IA personalizados en lugar de GPU NVIDIA. El preentrenamiento abarcó millones de horas de acelerador en más de 35 billones de tokens sin retrocesos ni picos de pérdida irrecuperables, demostrando capacidad de entrenamiento a escala fronteriza en hardware alternativo.

Aspectos destacados de la arquitectura

LongCat 2.0 introduce LongCat Sparse Attention (Atención Dispersa LongCat), diseñada para manejar tareas de contexto largo de manera eficiente. El modelo fue entrenado con cientos de miles de millones de tokens de datos de contexto de 1M. Combinado con un post-entrenamiento dedicado, esto le otorga a LongCat 2.0 un rendimiento sólido en tareas de codificación y agente.

Estado

El repositorio de HuggingFace (meituan-longcat/LongCat-2.0) está activo con documentación y especificaciones, pero los pesos del modelo aún no se han publicado. El equipo ha indicado que los pesos se publicarán próximamente.

Especificaciones clave

Importancia: Entrenamiento en ASIC de IA

Aspectos destacados de la arquitectura

Estado

Enlaces