Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

NVIDIAがAI学習高速化手法公開
Generatived
26/6/22 0:00
NVIDIA(米カリフォルニア州サンタクララ)は、Transformerベースの大規模AIモデル向けに、低精度演算を活用した学習高速化手法と評価方法を公開した。学習効率向上とコスト削減を支援する取り組みという。
同社によると、NVIDIA HopperおよびBlackwell GPUで利用可能なFP8やNVFP4を活用し、モデル設定から実際のGEMM演算形状を導出して性能を測定することで、最適な精度設定を事前に評価できるとしている。
公開されたベンチマーク手法では、CodonFM 5Bを例に、行列演算ごとの処理時間や量子化オーバーヘッドを可視化する。NVFP4は一部の大規模演算でMXFP8比最大1.66倍の性能向上を示した一方、演算規模によって効果に差が見られたという。
同社は、Transformer Engineを活用した評価により、学習前に精度設定やアーキテクチャ設計を検証できると説明している。これにより、不要なGPU利用や長時間の試行錯誤を抑制できるとしている。
最新のニュース
Microsoft、Claude Fable 5提供開始
26/6/19 0:00
Microsoft(米国ワシントン州レドモンド)は、Anthropicの最新AIモデル「Claude Fable 5」の提供をMicrosoft Foundryで開始した。
Google、DiffusionGemma公開
26/6/19 0:00
Google(米国カリフォルニア州マウンテンビュー)は、テキスト生成向けの実験的オープンモデル「DiffusionGemma」を公開した。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
Microsoft、Claude Fable 5提供開始
26/6/19 0:00
Microsoft(米国ワシントン州レドモンド)は、Anthropicの最新AIモデル「Claude Fable 5」の提供をMicrosoft Foundryで開始した。
Google、DiffusionGemma公開
26/6/19 0:00
Google(米国カリフォルニア州マウンテンビュー)は、テキスト生成向けの実験的オープンモデル「DiffusionGemma」を公開した。






