Meituan publica como código abierto LongCat 2.0: modelo MoE de 1.6 billones de parámetros entrenado en ASIC de IA
Meituan lanza LongCat 2.0, un modelo de lenguaje MoE de 1.6 billones de parámetros con una ventana de contexto de 1 millón de tokens, entrenado completamente en hardware ASIC de IA. Los pesos del modelo se publicarán próximamente bajo licencia MIT.
El 30 de junio de 2026, Meituan (美团) presentó LongCat 2.0, un modelo de lenguaje masivo de mezcla de expertos con 1.6 billones de parámetros totales y aproximadamente 48 mil millones de parámetros activados por token. El modelo tiene licencia MIT y representa uno de los modelos de pesos abiertos más grandes jamás publicados.
Los pesos del modelo aún no están disponibles: el equipo indica "próximamente" en el repositorio de HuggingFace. Este artículo cubre el anuncio y la arquitectura.
Especificaciones clave
| Especificación | Detalle |
|---|---|
| Arquitectura | Mixture-of-Experts (MoE) |
| Parámetros totales | 1.6 billones |
| Parámetros activados | ~48B por token |
| Ventana de contexto | 1 millón de tokens (Atención Dispersa LongCat) |
| Datos de entrenamiento | Más de 35 billones de tokens |
| Hardware de entrenamiento | Superpods de ASIC de IA (no GPU NVIDIA) |
| Licencia | MIT |
Importancia: Entrenamiento en ASIC de IA
Uno de los aspectos más notables de LongCat 2.0 es que tanto el entrenamiento completo como el despliegue a gran escala se construyeron completamente sobre superpods de ASIC de IA: chips aceleradores de IA personalizados en lugar de GPU NVIDIA. El preentrenamiento abarcó millones de horas de acelerador en más de 35 billones de tokens sin retrocesos ni picos de pérdida irrecuperables, demostrando capacidad de entrenamiento a escala fronteriza en hardware alternativo.
Aspectos destacados de la arquitectura
LongCat 2.0 introduce LongCat Sparse Attention (Atención Dispersa LongCat), diseñada para manejar tareas de contexto largo de manera eficiente. El modelo fue entrenado con cientos de miles de millones de tokens de datos de contexto de 1M. Combinado con un post-entrenamiento dedicado, esto le otorga a LongCat 2.0 un rendimiento sólido en tareas de codificación y agente.
Estado
El repositorio de HuggingFace (meituan-longcat/LongCat-2.0) está activo con documentación y especificaciones, pero los pesos del modelo aún no se han publicado. El equipo ha indicado que los pesos se publicarán próximamente.
Enlaces
- Repositorio de HuggingFace
- Publicación técnica del blog
- Licencia: MIT