Meituan、LongCat 2.0をオープンソース化:AI ASIC上で学習した1.6兆パラメータMoEモデル

news

MeituanがLongCat 2.0を公開。1.6兆パラメータのMoE言語モデルで、100万トークンのコンテキストウィンドウを持ち、完全にAI ASICハードウェア上で学習。モデルウェイトは近日中にMITライセンスで公開予定。

2026年6月30日、Meituan(美团)はLongCat 2.0を発表しました。これは1.6兆の総パラメータを持ち、トークンあたり約480億パラメータを活性化する大規模Mixture-of-Experts言語モデルです。モデルはMITライセンスで提供され、これまで公開された中で最大級のオープンウェイトモデルの一つです。

モデルウェイトはまだ入手できません。チームはHuggingFaceリポジトリで「近日公開」としています。本記事は発表とアーキテクチャについて扱います。

主な仕様

仕様詳細
アーキテクチャMixture-of-Experts(MoE)
総パラメータ数1.6兆
活性化パラメータ数トークンあたり約48B
コンテキストウィンドウ100万トークン(LongCat Sparse Attention)
学習データ35兆トークン以上
学習ハードウェアAI ASICスーパーポッド(NVIDIA GPU不使用)
ライセンスMIT

意義:AI ASICでの学習

LongCat 2.0の最も注目すべき点の一つは、フルトレーニングと大規模デプロイメントの両方がAI ASICスーパーポッド上で完全に構築されていることです。これはNVIDIA GPUではなくカスタムAIアクセラレータチップです。プリトレーニングは35兆トークン以上にわたって数百万アクセラレータ時間を費やし、ロールバックや回復不能な損失スパイクなしに実行され、代替ハードウェアでのフロンティアスケールのトレーニング能力を示しました。

アーキテクチャのハイライト

LongCat 2.0はLongCat Sparse Attentionを導入し、長いコンテキストのタスクを効率的に処理します。モデルは数十億トークンの100万コンテキストデータで学習されました。専用のポストトレーニングと組み合わせることで、LongCat 2.0はコーディングやエージェントタスクで優れたパフォーマンスを発揮します。

ステータス

HuggingFaceリポジトリ(meituan-longcat/LongCat-2.0)はドキュメントと仕様とともに公開されていますが、モデルウェイトはまだリリースされていません。チームは後日提供するとしています。

リンク

Meituan、LongCat 2.0をオープンソース化:AI ASIC上で学習した1.6兆パラメータMoEモデル | ComfyUI Wiki