Generatived（Beta）｜生成AIの最新ニュースとトレンドを提供

NVIDIA GB200 NVL72がMoEモデルのパフォーマンスを向上

Generatived

25/12/5 0:00

Kimi K2 ThinkingやDeepSeek-R1など、最もインテリジェントなオープンソースモデル上位10位は、人間の脳のタスク特異的な領域活性化に類似したMixture-of-Experts（MoE）アーキテクチャを採用しています。このアーキテクチャは、各AIトークンに必要な「エキスパート」のみを活性化することで効率的なトークン生成を可能にし、計算負荷を大幅に増加させることなくパフォーマンスを向上させます。

NVIDIAのGB200 NVL72システムは、MoEモデルのスケーリングにおいて重要な役割を果たしており、高性能と効率性を促進するハードウェアとソフトウェアの最適化を提供しています。例えば、Kimi K2 Thinkingモデルは、GB200 NVL72上で以前のシステムと比較してパフォーマンスが10倍向上しており、NVIDIAのフルスタック推論プラットフォームがMoEアーキテクチャの最適化に有効であることを実証しています。

MoEモデルのスケーリングは、その複雑さと規模の大きさから従来困難でしたが、NVIDIAのGB200 NVL72システムは、エクストリーム・コデザインによってこれらの問題を解決します。このシステムは72基の相互接続されたGPUを搭載し、エキスパートレベルの並列処理を可能にし、メモリ帯域幅の負荷を軽減します。この設計により、エキスパート間のコミュニケーションが大幅に改善され、全体的なパフォーマンスが向上します。

大手クラウドサービスプロバイダーとNVIDIAクラウドパートナーはGB200 NVL72を導入し、そのメリットを世界規模で享受しています。CoreWeaveやDeepLといった企業は、このシステムを活用してAIモデルの効率とパフォーマンスを向上させています。NVIDIAのMoEモデルのスケーリングにおける進歩は、AI機能の新たな基準を確立し、AIシステムが強力かつ効率的になる未来を約束します。

ソース：NVIDIA Developer Blog