Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

NVIDIA Blackwell が InferenceMAX AI ベンチマークでトップに
Generatived
25/10/14 0:00
NVIDIAは、最新のSemiAnalysis InferenceMAX v1ベンチマークで圧倒的な成績を収め、AIパフォーマンスの新たな基準を確立しました。様々なモデルとシナリオにおける総計算コストを初めて測定したこのベンチマークは、NVIDIAのBlackwellプラットフォームが業界最高のパフォーマンスと効率性を提供することを示しました。この成果は、推論の経済性がますます重要になっているAIファクトリーにとって特に重要です。
同社のGB200 NVL72システムは、500万ドルの投資を7,500万ドルのトークン収益に転換できるという、驚異的な投資収益率(ROI)を示しました。この15倍のROIは、NVIDIAのAIソリューションの経済効果を如実に示しています。さらに、B200ソフトウェアの最適化により、総所有コスト(TCO)が大幅に削減され、gpt-ossでは100万トークンあたりわずか2セントという、従来の5分の1のコストを実現しました。
NVIDIAのB200システムは、スループットとインタラクションにおいても優れており、GPUあたり60,000トークン/秒を実現し、gpt-ossではユーザーあたり1,000トークン/秒を維持しています。これらの結果は、AIアプリケーションにおける複雑な推論に対する高まる需要に対応するために設計された最新のNVIDIA TensorRT-LLMスタックによって実現されています。NVIDIAの副社長であるイアン・バック氏は、大規模なAI導入におけるパフォーマンスと効率性の重要性を強調し、同社のフルスタックアプローチへのコミットメントを反映させました。
InferenceMAX v1ベンチマークは、ハードウェアとソフトウェアの協調設計による最適化を通じてイノベーションを継続的に推進するNVIDIAのAI分野におけるリーダーシップを証明するものです。NVFP4低精度フォーマットや第5世代NVIDIA NVLinkといったBlackwellアーキテクチャの機能が、その優れたパフォーマンスに貢献しています。堅牢なエコシステムと継続的な改善への注力により、NVIDIAはAIパイロットから本格的なAIファクトリーへの移行を支援する上で優位な立場にあり、企業のROI最大化とパフォーマンスの収益化を支援します。
最新のニュース
aicrew生成AI教育で福祉連携強化
26/4/15 0:00
aicrew(東京都目黒区)は、就労継続支援B型事業所MAISONと業務提携し、生成AIを活用した動画制作スキル教育の提供を開始したと発表した。
ピネアルAI記事制作サービス提供開始
26/4/14 0:00
ピネアル(東京都港区)は、SEO記事ライティング自動化AIツール『UPRESS』を活用し、ワン・パブリッシングと共同で「AIオウンドメディアサービス by UPRESS」を4月13日より提供開始したと発表した。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
aicrew生成AI教育で福祉連携強化
26/4/15 0:00
aicrew(東京都目黒区)は、就労継続支援B型事業所MAISONと業務提携し、生成AIを活用した動画制作スキル教育の提供を開始したと発表した。
ピネアルAI記事制作サービス提供開始
26/4/14 0:00
ピネアル(東京都港区)は、SEO記事ライティング自動化AIツール『UPRESS』を活用し、ワン・パブリッシングと共同で「AIオウンドメディアサービス by UPRESS」を4月13日より提供開始したと発表した。

%20(1).webp)



