Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

NVIDIA Blackwell が InferenceMAX AI ベンチマークでトップに
Generatived
25/10/14 0:00
NVIDIAは、最新のSemiAnalysis InferenceMAX v1ベンチマークで圧倒的な成績を収め、AIパフォーマンスの新たな基準を確立しました。様々なモデルとシナリオにおける総計算コストを初めて測定したこのベンチマークは、NVIDIAのBlackwellプラットフォームが業界最高のパフォーマンスと効率性を提供することを示しました。この成果は、推論の経済性がますます重要になっているAIファクトリーにとって特に重要です。
同社のGB200 NVL72システムは、500万ドルの投資を7,500万ドルのトークン収益に転換できるという、驚異的な投資収益率(ROI)を示しました。この15倍のROIは、NVIDIAのAIソリューションの経済効果を如実に示しています。さらに、B200ソフトウェアの最適化により、総所有コスト(TCO)が大幅に削減され、gpt-ossでは100万トークンあたりわずか2セントという、従来の5分の1のコストを実現しました。
NVIDIAのB200システムは、スループットとインタラクションにおいても優れており、GPUあたり60,000トークン/秒を実現し、gpt-ossではユーザーあたり1,000トークン/秒を維持しています。これらの結果は、AIアプリケーションにおける複雑な推論に対する高まる需要に対応するために設計された最新のNVIDIA TensorRT-LLMスタックによって実現されています。NVIDIAの副社長であるイアン・バック氏は、大規模なAI導入におけるパフォーマンスと効率性の重要性を強調し、同社のフルスタックアプローチへのコミットメントを反映させました。
InferenceMAX v1ベンチマークは、ハードウェアとソフトウェアの協調設計による最適化を通じてイノベーションを継続的に推進するNVIDIAのAI分野におけるリーダーシップを証明するものです。NVFP4低精度フォーマットや第5世代NVIDIA NVLinkといったBlackwellアーキテクチャの機能が、その優れたパフォーマンスに貢献しています。堅牢なエコシステムと継続的な改善への注力により、NVIDIAはAIパイロットから本格的なAIファクトリーへの移行を支援する上で優位な立場にあり、企業のROI最大化とパフォーマンスの収益化を支援します。
最新のニュース
ラーゲイト Copilot支援開始
26/4/10 0:00
ラーゲイト(東京都中央区)は、Microsoft Copilot Studioの導入から内製化までを一体で支援するサービスの提供開始を発表した。
ゴートマン Claude導入支援開始
26/4/10 0:00
ゴートマン(東京都世田谷区)は、Claude CodeおよびClaude Coworkの企業導入を支援する「Claude導入くん」の提供開始を発表した。
AIセキュリティBPO無料提供開始
26/4/10 0:00
AIセキュリティソリューションズ(東京都)は、IT部門業務を代行する「AI BPO ITサポート代行サービス」の無料トライアルおよび無料相談の提供開始を発表した。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
ラーゲイト Copilot支援開始
26/4/10 0:00
ラーゲイト(東京都中央区)は、Microsoft Copilot Studioの導入から内製化までを一体で支援するサービスの提供開始を発表した。
ゴートマン Claude導入支援開始
26/4/10 0:00
ゴートマン(東京都世田谷区)は、Claude CodeおよびClaude Coworkの企業導入を支援する「Claude導入くん」の提供開始を発表した。
AIセキュリティBPO無料提供開始
26/4/10 0:00
AIセキュリティソリューションズ(東京都)は、IT部門業務を代行する「AI BPO ITサポート代行サービス」の無料トライアルおよび無料相談の提供開始を発表した。


%20(1).webp)



