top of page
Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
%20(1).webp)
NVIDIAがMLPerf訓練性能で全種目首位
Generatived
26/6/22 0:00
NVIDIA(米カリフォルニア州サンタクララ)は、AI学習性能ベンチマーク「MLPerf Training v6.0」において、全ベンチマークで最速の学習時間を達成したと発表した。
今回のMLPerfでは、新たに大規模MoE(Mixture of Experts)モデル「DeepSeek-V3 671B」および「GPT-OSS-20B」が追加された。NVIDIAは全7種目に唯一参加し、すべてのベンチマークで最高性能を記録したという。
同社は「GB300 NVL72」および「GB200 NVL72」を用いて最大8,192基のGPUによる大規模学習を実施。DeepSeek-V3 671Bでは8,192基構成で2.02分、Llama 3.1 405Bでは7.07分の学習時間を達成した。
性能向上の背景として、CUDA Graphsの全面活用やCuTe DSLによるカーネル最適化、MXFP8精度による演算高速化など複数のソフトウェア技術を挙げている。また、Spectrum-X EthernetやQuantum InfiniBandを活用した大規模分散学習基盤も成果に貢献したとしている。

