Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

NVIDIAがAI学習高速化手法公開
Generatived
26/6/22 0:00
NVIDIA(米カリフォルニア州サンタクララ)は、Transformerベースの大規模AIモデル向けに、低精度演算を活用した学習高速化手法と評価方法を公開した。学習効率向上とコスト削減を支援する取り組みという。
同社によると、NVIDIA HopperおよびBlackwell GPUで利用可能なFP8やNVFP4を活用し、モデル設定から実際のGEMM演算形状を導出して性能を測定することで、最適な精度設定を事前に評価できるとしている。
公開されたベンチマーク手法では、CodonFM 5Bを例に、行列演算ごとの処理時間や量子化オーバーヘッドを可視化する。NVFP4は一部の大規模演算でMXFP8比最大1.66倍の性能向上を示した一方、演算規模によって効果に差が見られたという。
同社は、Transformer Engineを活用した評価により、学習前に精度設定やアーキテクチャ設計を検証できると説明している。これにより、不要なGPU利用や長時間の試行錯誤を抑制できるとしている。
最新のニュース
NVIDIA、MiniMax M3提供拡大
26/6/18 0:00
NVIDIA(米カリフォルニア州サンタクララ)は、長文推論やエージェント型ワークフローに対応するマルチモーダルAIモデル「MiniMax M3」の利用環境を拡充したと発表した。
NVIDIA、AgentPerfで性能訴求
26/6/18 0:00
NVIDIA(米カリフォルニア州サンタクララ)は、Artificial Analysisが公開した新たなAIエージェント向け推論ベンチマーク「AA-AgentPerf」において、NVIDIA GB300 NVL72が高い性能と電力効率を示したと発表した。
PreplyがAI活用で語学学習を強化
26/6/18 0:00
Preply(米ニューヨーク)は、OpenAIの技術を活用した「Lesson Insights」により、オンライン語学学習の体験向上を進めていると発表した。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
NVIDIA、MiniMax M3提供拡大
26/6/18 0:00
NVIDIA(米カリフォルニア州サンタクララ)は、長文推論やエージェント型ワークフローに対応するマルチモーダルAIモデル「MiniMax M3」の利用環境を拡充したと発表した。
NVIDIA、AgentPerfで性能訴求
26/6/18 0:00
NVIDIA(米カリフォルニア州サンタクララ)は、Artificial Analysisが公開した新たなAIエージェント向け推論ベンチマーク「AA-AgentPerf」において、NVIDIA GB300 NVL72が高い性能と電力効率を示したと発表した。
PreplyがAI活用で語学学習を強化
26/6/18 0:00
Preply(米ニューヨーク)は、OpenAIの技術を活用した「Lesson Insights」により、オンライン語学学習の体験向上を進めていると発表した。

.webp)
%20(1).webp)
%20(1).webp)


