top of page
Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

NVIDIAがAI学習高速化手法公開
Generatived
26/6/22 0:00
NVIDIA(米カリフォルニア州サンタクララ)は、Transformerベースの大規模AIモデル向けに、低精度演算を活用した学習高速化手法と評価方法を公開した。学習効率向上とコスト削減を支援する取り組みという。
同社によると、NVIDIA HopperおよびBlackwell GPUで利用可能なFP8やNVFP4を活用し、モデル設定から実際のGEMM演算形状を導出して性能を測定することで、最適な精度設定を事前に評価できるとしている。
公開されたベンチマーク手法では、CodonFM 5Bを例に、行列演算ごとの処理時間や量子化オーバーヘッドを可視化する。NVFP4は一部の大規模演算でMXFP8比最大1.66倍の性能向上を示した一方、演算規模によって効果に差が見られたという。
同社は、Transformer Engineを活用した評価により、学習前に精度設定やアーキテクチャ設計を検証できると説明している。これにより、不要なGPU利用や長時間の試行錯誤を抑制できるとしている。

