Meituan、LongCat 2.0をオープンソース化：AI ASIC上で学習した1.6兆パラメータMoEモデル

2026年6月30日、Meituan（美团）はLongCat 2.0を発表しました。これは1.6兆の総パラメータを持ち、トークンあたり約480億パラメータを活性化する大規模Mixture-of-Experts言語モデルです。モデルはMITライセンスで提供され、これまで公開された中で最大級のオープンウェイトモデルの一つです。

モデルウェイトはまだ入手できません。チームはHuggingFaceリポジトリで「近日公開」としています。本記事は発表とアーキテクチャについて扱います。

主な仕様

仕様	詳細
アーキテクチャ	Mixture-of-Experts（MoE）
総パラメータ数	1.6兆
活性化パラメータ数	トークンあたり約48B
コンテキストウィンドウ	100万トークン（LongCat Sparse Attention）
学習データ	35兆トークン以上
学習ハードウェア	AI ASICスーパーポッド（NVIDIA GPU不使用）
ライセンス	MIT

意義：AI ASICでの学習

LongCat 2.0の最も注目すべき点の一つは、フルトレーニングと大規模デプロイメントの両方がAI ASICスーパーポッド上で完全に構築されていることです。これはNVIDIA GPUではなくカスタムAIアクセラレータチップです。プリトレーニングは35兆トークン以上にわたって数百万アクセラレータ時間を費やし、ロールバックや回復不能な損失スパイクなしに実行され、代替ハードウェアでのフロンティアスケールのトレーニング能力を示しました。

アーキテクチャのハイライト

LongCat 2.0はLongCat Sparse Attentionを導入し、長いコンテキストのタスクを効率的に処理します。モデルは数十億トークンの100万コンテキストデータで学習されました。専用のポストトレーニングと組み合わせることで、LongCat 2.0はコーディングやエージェントタスクで優れたパフォーマンスを発揮します。

ステータス

HuggingFaceリポジトリ（meituan-longcat/LongCat-2.0）はドキュメントと仕様とともに公開されていますが、モデルウェイトはまだリリースされていません。チームは後日提供するとしています。

主な仕様

意義：AI ASICでの学習

アーキテクチャのハイライト

ステータス

リンク