Generatived（Beta）｜生成AIの最新ニュースとトレンドを提供

NVIDIA Blackwell が InferenceMAX AI ベンチマークでトップに

Generatived

25/10/14 0:00

NVIDIAは、最新のSemiAnalysis InferenceMAX v1ベンチマークで圧倒的な成績を収め、AIパフォーマンスの新たな基準を確立しました。様々なモデルとシナリオにおける総計算コストを初めて測定したこのベンチマークは、NVIDIAのBlackwellプラットフォームが業界最高のパフォーマンスと効率性を提供することを示しました。この成果は、推論の経済性がますます重要になっているAIファクトリーにとって特に重要です。

同社のGB200 NVL72システムは、500万ドルの投資を7,500万ドルのトークン収益に転換できるという、驚異的な投資収益率（ROI）を示しました。この15倍のROIは、NVIDIAのAIソリューションの経済効果を如実に示しています。さらに、B200ソフトウェアの最適化により、総所有コスト（TCO）が大幅に削減され、gpt-ossでは100万トークンあたりわずか2セントという、従来の5分の1のコストを実現しました。

NVIDIAのB200システムは、スループットとインタラクションにおいても優れており、GPUあたり60,000トークン/秒を実現し、gpt-ossではユーザーあたり1,000トークン/秒を維持しています。これらの結果は、AIアプリケーションにおける複雑な推論に対する高まる需要に対応するために設計された最新のNVIDIA TensorRT-LLMスタックによって実現されています。NVIDIAの副社長であるイアン・バック氏は、大規模なAI導入におけるパフォーマンスと効率性の重要性を強調し、同社のフルスタックアプローチへのコミットメントを反映させました。

InferenceMAX v1ベンチマークは、ハードウェアとソフトウェアの協調設計による最適化を通じてイノベーションを継続的に推進するNVIDIAのAI分野におけるリーダーシップを証明するものです。NVFP4低精度フォーマットや第5世代NVIDIA NVLinkといったBlackwellアーキテクチャの機能が、その優れたパフォーマンスに貢献しています。堅牢なエコシステムと継続的な改善への注力により、NVIDIAはAIパイロットから本格的なAIファクトリーへの移行を支援する上で優位な立場にあり、企業のROI最大化とパフォーマンスの収益化を支援します。

ソース：NVIDIA Developer Blog