top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA Blackwell が InferenceMAX AI ベンチマークでトップに

Generatived

25/10/14 0:00

NVIDIAは、最新のSemiAnalysis InferenceMAX v1ベンチマークで圧倒的な成績を収め、AIパフォーマンスの新たな基準を確立しました。様々なモデルとシナリオにおける総計算コストを初めて測定したこのベンチマークは、NVIDIAのBlackwellプラットフォームが業界最高のパフォーマンスと効率性を提供することを示しました。この成果は、推論の経済性がますます重要になっているAIファクトリーにとって特に重要です。

同社のGB200 NVL72システムは、500万ドルの投資を7,500万ドルのトークン収益に転換できるという、驚異的な投資収益率(ROI)を示しました。この15倍のROIは、NVIDIAのAIソリューションの経済効果を如実に示しています。さらに、B200ソフトウェアの最適化により、総所有コスト(TCO)が大幅に削減され、gpt-ossでは100万トークンあたりわずか2セントという、従来の5分の1のコストを実現しました。

NVIDIAのB200システムは、スループットとインタラクションにおいても優れており、GPUあたり60,000トークン/秒を実現し、gpt-ossではユーザーあたり1,000トークン/秒を維持しています。これらの結果は、AIアプリケーションにおける複雑な推論に対する高まる需要に対応するために設計された最新のNVIDIA TensorRT-LLMスタックによって実現されています。NVIDIAの副社長であるイアン・バック氏は、大規模なAI導入におけるパフォーマンスと効率性の重要性を強調し、同社のフルスタックアプローチへのコミットメントを反映させました。

InferenceMAX v1ベンチマークは、ハードウェアとソフトウェアの協調設計による最適化を通じてイノベーションを継続的に推進するNVIDIAのAI分野におけるリーダーシップを証明するものです。NVFP4低精度フォーマットや第5世代NVIDIA NVLinkといったBlackwellアーキテクチャの機能が、その優れたパフォーマンスに貢献しています。堅牢なエコシステムと継続的な改善への注力により、NVIDIAはAIパイロットから本格的なAIファクトリーへの移行を支援する上で優位な立場にあり、企業のROI最大化とパフォーマンスの収益化を支援します。

この記事を共有:

最新のニュース
NVIDIA SlurmをKubernetes統合運用

NVIDIA SlurmをKubernetes統合運用

26/4/13 0:00

NVIDIA(米国カリフォルニア州)は、SlurmをKubernetes上で運用する「Slinky slurm-operator」の仕組みを示したとみられる。

Microsoft エージェント型SOC展望

Microsoft エージェント型SOC展望

26/4/13 0:00

Microsoft(米国ワシントン州)は、セキュリティ運用の新モデル「agentic SOC」に関する見解を示したとみられる。

AIデータ行政AI基盤提供開始

AIデータ行政AI基盤提供開始

26/4/13 0:00

AIデータ(東京都港区)は、議員や自治体向けAIソリューション「AI GovOffice on IDX」の提供開始を発表したとみられる。

Webetter企業向けAI基盤提供開始

Webetter企業向けAI基盤提供開始

26/4/13 0:00

Webetter(東京都港区)は、企業向けAI実行プラットフォーム「TakoFlow」の正式提供を開始したと発表したとみられる。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
NVIDIA SlurmをKubernetes統合運用

NVIDIA SlurmをKubernetes統合運用

26/4/13 0:00

NVIDIA(米国カリフォルニア州)は、SlurmをKubernetes上で運用する「Slinky slurm-operator」の仕組みを示したとみられる。

Microsoft エージェント型SOC展望

Microsoft エージェント型SOC展望

26/4/13 0:00

Microsoft(米国ワシントン州)は、セキュリティ運用の新モデル「agentic SOC」に関する見解を示したとみられる。

AIデータ行政AI基盤提供開始

AIデータ行政AI基盤提供開始

26/4/13 0:00

AIデータ(東京都港区)は、議員や自治体向けAIソリューション「AI GovOffice on IDX」の提供開始を発表したとみられる。

Webetter企業向けAI基盤提供開始

Webetter企業向けAI基盤提供開始

26/4/13 0:00

Webetter(東京都港区)は、企業向けAI実行プラットフォーム「TakoFlow」の正式提供を開始したと発表したとみられる。

bottom of page