top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA Blackwell が InferenceMAX AI ベンチマークでトップに

Generatived

25/10/14 0:00

NVIDIAは、最新のSemiAnalysis InferenceMAX v1ベンチマークで圧倒的な成績を収め、AIパフォーマンスの新たな基準を確立しました。様々なモデルとシナリオにおける総計算コストを初めて測定したこのベンチマークは、NVIDIAのBlackwellプラットフォームが業界最高のパフォーマンスと効率性を提供することを示しました。この成果は、推論の経済性がますます重要になっているAIファクトリーにとって特に重要です。

同社のGB200 NVL72システムは、500万ドルの投資を7,500万ドルのトークン収益に転換できるという、驚異的な投資収益率(ROI)を示しました。この15倍のROIは、NVIDIAのAIソリューションの経済効果を如実に示しています。さらに、B200ソフトウェアの最適化により、総所有コスト(TCO)が大幅に削減され、gpt-ossでは100万トークンあたりわずか2セントという、従来の5分の1のコストを実現しました。

NVIDIAのB200システムは、スループットとインタラクションにおいても優れており、GPUあたり60,000トークン/秒を実現し、gpt-ossではユーザーあたり1,000トークン/秒を維持しています。これらの結果は、AIアプリケーションにおける複雑な推論に対する高まる需要に対応するために設計された最新のNVIDIA TensorRT-LLMスタックによって実現されています。NVIDIAの副社長であるイアン・バック氏は、大規模なAI導入におけるパフォーマンスと効率性の重要性を強調し、同社のフルスタックアプローチへのコミットメントを反映させました。

InferenceMAX v1ベンチマークは、ハードウェアとソフトウェアの協調設計による最適化を通じてイノベーションを継続的に推進するNVIDIAのAI分野におけるリーダーシップを証明するものです。NVFP4低精度フォーマットや第5世代NVIDIA NVLinkといったBlackwellアーキテクチャの機能が、その優れたパフォーマンスに貢献しています。堅牢なエコシステムと継続的な改善への注力により、NVIDIAはAIパイロットから本格的なAIファクトリーへの移行を支援する上で優位な立場にあり、企業のROI最大化とパフォーマンスの収益化を支援します。

この記事を共有:

最新のニュース
Aurora Mobile新AI基盤公開

Aurora Mobile新AI基盤公開

26/4/13 0:00

Aurora Mobile(中国深圳市)は、統合型マルチモーダルAIプラットフォーム「Modellix.ai」を正式にローンチしたと発表したとみられる。

ストックマーク事業立案AI公開開始

ストックマーク事業立案AI公開開始

26/4/13 0:00

ストックマーク(東京都港区)は、R&Dや新規事業の検討を支援するAIエージェント2種のDEMO版を公開したと明らかにした。

SoundHound AI通信向け提携発表

SoundHound AI通信向け提携発表

26/4/13 0:00

SoundHound AI(米国カリフォルニア州)は、通信事業者団体Associated Carrier Groupとの戦略的提携を発表したとみられる。

電通総研、自治体DX支援AI提供開始

電通総研、自治体DX支援AI提供開始

26/4/10 0:00

電通総研(東京都港区)は、生成AIを活用し自治体のDXや業務改革を支援するソリューション「minnect AI-BPR」の提供を4月8日に開始したと発表した。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
Aurora Mobile新AI基盤公開

Aurora Mobile新AI基盤公開

26/4/13 0:00

Aurora Mobile(中国深圳市)は、統合型マルチモーダルAIプラットフォーム「Modellix.ai」を正式にローンチしたと発表したとみられる。

ストックマーク事業立案AI公開開始

ストックマーク事業立案AI公開開始

26/4/13 0:00

ストックマーク(東京都港区)は、R&Dや新規事業の検討を支援するAIエージェント2種のDEMO版を公開したと明らかにした。

SoundHound AI通信向け提携発表

SoundHound AI通信向け提携発表

26/4/13 0:00

SoundHound AI(米国カリフォルニア州)は、通信事業者団体Associated Carrier Groupとの戦略的提携を発表したとみられる。

電通総研、自治体DX支援AI提供開始

電通総研、自治体DX支援AI提供開始

26/4/10 0:00

電通総研(東京都港区)は、生成AIを活用し自治体のDXや業務改革を支援するソリューション「minnect AI-BPR」の提供を4月8日に開始したと発表した。

bottom of page