top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA Blackwell Ultra が大規模 AI システムを強化

Generatived

25/3/20 4:00

NVIDIA は、トレーニング、トレーニング後、テスト時のスケーリングなど、AI 推論の高まる需要に応えるために設計された新しい高速コンピューティング プラットフォーム Blackwell Ultra を発表しました。このプラットフォームは、36 個の NVIDIA Grace CPU と 72 個の Blackwell Ultra GPU を組み合わせた液冷ラック スケール ソリューションを特徴とする NVIDIA GB300 NVL72 システムに搭載される予定です。このシステムは、130 TB/秒という驚異的な NVLink 帯域幅を誇り、大規模な AI 推論のための強力なソリューションとして位置付けられています。

Blackwell Ultra プラットフォームは、リアルタイムのマルチエージェント AI システムとロング コンテキスト推論に不可欠な、強化された AI 推論パフォーマンスを実現することを約束します。新しい Blackwell Ultra Tensor コアは、AI コンピューティング FLOPS を大幅に向上させ、GB300 NVL72 モデルは、以前のモデルと比較して最大 70 倍の AI FLOPS を実現します。このパフォーマンスの向上は、GPU あたり最大 288 GB の HBM3e メモリとラックあたり最大 40 TB の高速コヒーレント メモリによってサポートされており、大規模なモデルと複雑なタスクを同時に処理できます。

大規模なマルチノード推論のパフォーマンスを最適化するために、Blackwell Ultra は PCIe Gen6 接続と NVIDIA ConnectX-8 800G SuperNIC を搭載しており、ネットワーク帯域幅を 800 Gb/s に拡張します。これは、GPU ノード間で推論 AI サービスをスケールアップするように設計されたオープンソース ライブラリである NVIDIA Dynamo によって補完されます。NVIDIA Quantum-X800 および NVIDIA Spectrum-X ネットワーキング プラットフォームとの統合により、AI ファクトリーとクラウド データ センターは、3 つのスケーリング法則によって決定されるワークロード要求を効率的に管理できます。

NVIDIA の GB300 NVL72 は、AI ファクトリーの出力を大幅に向上させると予測されており、ユーザー 1 人あたりの 1 秒あたりのスループット トークンが 10 倍、メガワットあたりの 1 秒あたりのスループット トークンが 5 倍向上します。この複合効果により、AI ファクトリーの出力パフォーマンスが全体で 50 倍に増加する可能性があります。Blackwell Ultra 製品は、主要なクラウド サービス プロバイダーとサーバー メーカーのサポートを受けて、2025 年後半にパートナーから提供される予定です。

この記事を共有:

最新のニュース
NTT西日本がGX支援で提携

NTT西日本がGX支援で提携

26/7/3 0:00

NTT西日本(大阪府大阪市)とタンソーマンGX(東京都渋谷区)は、自治体と連携した中堅・中小企業向け脱炭素支援を推進するため、業務提携契約を締結したと発表した。

Google Cloudが機密AI強化

Google Cloudが機密AI強化

26/7/3 0:00

Google Cloud(米カリフォルニア州マウンテンビュー)は、Confidential Computingを活用したAI向けセキュリティ機能を強化すると発表した。

マイクロソフト、Azure Files強化

マイクロソフト、Azure Files強化

26/7/3 0:00

Microsoft(米ワシントン州レドモンド)は、Linux向け共有ストレージサービス「Azure Files」の機能強化を発表した。

マイクロソフト、Azure最適化提案

マイクロソフト、Azure最適化提案

26/7/3 0:00

Microsoft(米ワシントン州レドモンド)は、Azure Infrastructure-as-a-Service(IaaS)のコスト最適化に関するガイドを公開し、コンピュート、ストレージ、ネットワークの設計見直しが運用効率と総保有コスト(TCO)の改善につながるとの考えを示した。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
NTT西日本がGX支援で提携

NTT西日本がGX支援で提携

26/7/3 0:00

NTT西日本(大阪府大阪市)とタンソーマンGX(東京都渋谷区)は、自治体と連携した中堅・中小企業向け脱炭素支援を推進するため、業務提携契約を締結したと発表した。

Google Cloudが機密AI強化

Google Cloudが機密AI強化

26/7/3 0:00

Google Cloud(米カリフォルニア州マウンテンビュー)は、Confidential Computingを活用したAI向けセキュリティ機能を強化すると発表した。

マイクロソフト、Azure Files強化

マイクロソフト、Azure Files強化

26/7/3 0:00

Microsoft(米ワシントン州レドモンド)は、Linux向け共有ストレージサービス「Azure Files」の機能強化を発表した。

マイクロソフト、Azure最適化提案

マイクロソフト、Azure最適化提案

26/7/3 0:00

Microsoft(米ワシントン州レドモンド)は、Azure Infrastructure-as-a-Service(IaaS)のコスト最適化に関するガイドを公開し、コンピュート、ストレージ、ネットワークの設計見直しが運用効率と総保有コスト(TCO)の改善につながるとの考えを示した。

bottom of page