top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA、効率性向上のためAIプラットフォームを強化

Generatived

26/1/14 0:00

NVIDIAは、AI運用におけるコスト効率の重要な指標であるワットあたりのトークンスループットを向上させるため、AIプラットフォームの強化に積極的に取り組んできました。GPU、CPU、ネットワーク、ソフトウェア、電力供給、冷却システム間の相乗効果を最適化することで、生成トークン100万個あたりのコストを削減することに成功しました。この改善は、個人消費者から大企業まで、様々なタスクにAIを活用するユーザーの増加に伴い、特に大きなメリットをもたらします。

NVIDIAの進歩はソフトウェアスタックにも及び、既存プラットフォームからより高いパフォーマンスを引き出せるよう微調整されています。この戦略は、NVIDIA GPUの性能を向上させるだけでなく、クラウドサービスプロバイダー、GPUクラウド、モデルビルダー、そして企業全体で既に導入されているインフラストラクチャの生産寿命を延ばすことにもつながります。

NVIDIAの推論ソフトウェアスタックへの最近のアップデートは、特にNVIDIA Blackwellアーキテクチャ上で実行する場合、大幅なパフォーマンス向上をもたらしました。これらのアップデートは、ソフトウェアスタックの全機能と相まって、洗練されたスパース混合エキスパート推論モデルであるDeepSeek-R1のパフォーマンス向上に大きく貢献しました。

72基のNVIDIA Blackwell GPUを搭載したNVIDIA GB200 NVL72ラックスケールプラットフォームは、AIパフォーマンスの最適化に対するNVIDIAのコミットメントを示すものです。このプラットフォームの設計は、頻繁なデータ交換を必要とするスパースMoEアーキテクチャに基づくモデル向けにカスタマイズされています。BlackwellアーキテクチャのNVFP4データ形式向けハードウェアアクセラレーションや、分散型サービングなどの最適化により、NVL72アーキテクチャとNVLinkスイッチテクノロジーがさらに活用され、DeepSeek-R1などのモデルで最高レベルのパフォーマンスを実現します。

この記事を共有:

最新のニュース
NVIDIA、AI強化のためのTensorRT Edge-LLMを発表

NVIDIA、AI強化のためのTensorRT Edge-LLMを発表

26/1/14 0:00

NVIDIAは、エッジコンピューティングにおける大規模言語モデル(LLM)とビジョン言語モデル(VLM)のパフォーマンスを向上させるために設計された、新しいオープンソースC++フレームワーク「TensorRT Edge-LLM」を発表しました。

DeepSeek、世界規模で生成AIの導入が急増していると発表

DeepSeek、世界規模で生成AIの導入が急増していると発表

26/1/14 0:00

最新の統計によると、人工知能(AI)の世界的な導入は着実に増加しており、2025年後半には1.2パーセントポイント増加する見込みです。

ローレンス・バークレー国立研究所が加速器アシスタントAIを発表

ローレンス・バークレー国立研究所が加速器アシスタントAIを発表

26/1/14 0:00

カリフォルニア州バークレーの美しい景観の中で、AIシステムが著名な粒子加速器におけるハイリスクな物理実験の効率を高めています。

NVIDIA AIBlueprintがE コマース カタログを強化

NVIDIA AIBlueprintがE コマース カタログを強化

26/1/14 0:00

Eコマースカタログは、商品情報が限られていることがしばしば障害となり、商品の認知度と顧客エンゲージメントに影響を与えています。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
NVIDIA、AI強化のためのTensorRT Edge-LLMを発表

NVIDIA、AI強化のためのTensorRT Edge-LLMを発表

26/1/14 0:00

NVIDIAは、エッジコンピューティングにおける大規模言語モデル(LLM)とビジョン言語モデル(VLM)のパフォーマンスを向上させるために設計された、新しいオープンソースC++フレームワーク「TensorRT Edge-LLM」を発表しました。

DeepSeek、世界規模で生成AIの導入が急増していると発表

DeepSeek、世界規模で生成AIの導入が急増していると発表

26/1/14 0:00

最新の統計によると、人工知能(AI)の世界的な導入は着実に増加しており、2025年後半には1.2パーセントポイント増加する見込みです。

ローレンス・バークレー国立研究所が加速器アシスタントAIを発表

ローレンス・バークレー国立研究所が加速器アシスタントAIを発表

26/1/14 0:00

カリフォルニア州バークレーの美しい景観の中で、AIシステムが著名な粒子加速器におけるハイリスクな物理実験の効率を高めています。

NVIDIA AIBlueprintがE コマース カタログを強化

NVIDIA AIBlueprintがE コマース カタログを強化

26/1/14 0:00

Eコマースカタログは、商品情報が限られていることがしばしば障害となり、商品の認知度と顧客エンゲージメントに影響を与えています。

bottom of page