Meituan、LongCat 2.0をオープンソース化:AI ASIC上で学習した1.6兆パラメータMoEモデル
MeituanがLongCat 2.0を公開。1.6兆パラメータのMoE言語モデルで、100万トークンのコンテキストウィンドウを持ち、完全にAI ASICハードウェア上で学習。モデルウェイトは近日中にMITライセンスで公開予定。
2026年6月30日、Meituan(美团)はLongCat 2.0を発表しました。これは1.6兆の総パラメータを持ち、トークンあたり約480億パラメータを活性化する大規模Mixture-of-Experts言語モデルです。モデルはMITライセンスで提供され、これまで公開された中で最大級のオープンウェイトモデルの一つです。
モデルウェイトはまだ入手できません。チームはHuggingFaceリポジトリで「近日公開」としています。本記事は発表とアーキテクチャについて扱います。
主な仕様
| 仕様 | 詳細 |
|---|---|
| アーキテクチャ | Mixture-of-Experts(MoE) |
| 総パラメータ数 | 1.6兆 |
| 活性化パラメータ数 | トークンあたり約48B |
| コンテキストウィンドウ | 100万トークン(LongCat Sparse Attention) |
| 学習データ | 35兆トークン以上 |
| 学習ハードウェア | AI ASICスーパーポッド(NVIDIA GPU不使用) |
| ライセンス | MIT |
意義:AI ASICでの学習
LongCat 2.0の最も注目すべき点の一つは、フルトレーニングと大規模デプロイメントの両方がAI ASICスーパーポッド上で完全に構築されていることです。これはNVIDIA GPUではなくカスタムAIアクセラレータチップです。プリトレーニングは35兆トークン以上にわたって数百万アクセラレータ時間を費やし、ロールバックや回復不能な損失スパイクなしに実行され、代替ハードウェアでのフロンティアスケールのトレーニング能力を示しました。
アーキテクチャのハイライト
LongCat 2.0はLongCat Sparse Attentionを導入し、長いコンテキストのタスクを効率的に処理します。モデルは数十億トークンの100万コンテキストデータで学習されました。専用のポストトレーニングと組み合わせることで、LongCat 2.0はコーディングやエージェントタスクで優れたパフォーマンスを発揮します。
ステータス
HuggingFaceリポジトリ(meituan-longcat/LongCat-2.0)はドキュメントと仕様とともに公開されていますが、モデルウェイトはまだリリースされていません。チームは後日提供するとしています。
リンク
- HuggingFaceリポジトリ
- テクニカルブログ記事
- ライセンス: MIT