Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

NVIDIAがAI学習高速化手法公開
Generatived
26/6/22 0:00
NVIDIA(米カリフォルニア州サンタクララ)は、Transformerベースの大規模AIモデル向けに、低精度演算を活用した学習高速化手法と評価方法を公開した。学習効率向上とコスト削減を支援する取り組みという。
同社によると、NVIDIA HopperおよびBlackwell GPUで利用可能なFP8やNVFP4を活用し、モデル設定から実際のGEMM演算形状を導出して性能を測定することで、最適な精度設定を事前に評価できるとしている。
公開されたベンチマーク手法では、CodonFM 5Bを例に、行列演算ごとの処理時間や量子化オーバーヘッドを可視化する。NVFP4は一部の大規模演算でMXFP8比最大1.66倍の性能向上を示した一方、演算規模によって効果に差が見られたという。
同社は、Transformer Engineを活用した評価により、学習前に精度設定やアーキテクチャ設計を検証できると説明している。これにより、不要なGPU利用や長時間の試行錯誤を抑制できるとしている。
最新のニュース
Meta、AI基盤支える計算資源強化
26/6/19 0:00
Meta(米国カリフォルニア州メンローパーク)は、AIサービスを支える計算資源(コンピュート)の重要性と、自社のインフラ戦略について説明した。
NVIDIA、DiffusionGemma高速化支援
26/6/19 0:00
NVIDIA(米国カリフォルニア州サンタクララ)は、Google DeepMindが公開した実験的オープンモデル「DiffusionGemma」の最適化を進め、RTX GPUやRTX PRO、DGX Spark環境で高速動作を実現したと発表した。
NVIDIA、DiffusionGemma活用拡大
26/6/18 0:00
NVIDIA(米国カリフォルニア州サンタクララ)は、Google DeepMindが開発したDiffusionGemmaについて、NVIDIAプラットフォーム向け最適化と企業向け展開支援を強化したと発表した。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
Meta、AI基盤支える計算資源強化
26/6/19 0:00
Meta(米国カリフォルニア州メンローパーク)は、AIサービスを支える計算資源(コンピュート)の重要性と、自社のインフラ戦略について説明した。
NVIDIA、DiffusionGemma高速化支援
26/6/19 0:00
NVIDIA(米国カリフォルニア州サンタクララ)は、Google DeepMindが公開した実験的オープンモデル「DiffusionGemma」の最適化を進め、RTX GPUやRTX PRO、DGX Spark環境で高速動作を実現したと発表した。
NVIDIA、DiffusionGemma活用拡大
26/6/18 0:00
NVIDIA(米国カリフォルニア州サンタクララ)は、Google DeepMindが開発したDiffusionGemmaについて、NVIDIAプラットフォーム向け最適化と企業向け展開支援を強化したと発表した。


%20(1).webp)

.webp)

