top of page
Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
%20(1).webp)
NVIDIA、AgentPerfで性能訴求
Generatived
26/6/18 0:00
NVIDIA(米カリフォルニア州サンタクララ)は、Artificial Analysisが公開した新たなAIエージェント向け推論ベンチマーク「AA-AgentPerf」において、NVIDIA GB300 NVL72が高い性能と電力効率を示したと発表した。
AA-AgentPerfは、エージェント型AIの実運用を想定した推論性能を測定する業界初のオープンベンチマークとされる。コーディング支援エージェントの実際の処理フローを再現し、同時実行可能なエージェント数や応答性能を評価する仕組みという。
同社によると、GB300 NVL72はDeepSeek-V4-Proを用いた測定で、前世代のNVIDIA H200と比較して最大20倍の同時エージェント処理性能を記録した。72基のGPUをNVLinkで接続する構成が大規模推論処理を支えているとしている。
さらに、TensorRT LLMやSGLang、vLLMなどの推論基盤との連携に加え、DeepGEMMやMega MoE最適化技術を活用することで高いスループットを実現したという。同社は今後、次世代のNVIDIA Vera Rubinプラットフォームによる性能向上も見込んでいる。

