top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA、効率性向上のためAIプラットフォームを強化

Generatived

26/1/14 0:00

NVIDIAは、AI運用におけるコスト効率の重要な指標であるワットあたりのトークンスループットを向上させるため、AIプラットフォームの強化に積極的に取り組んできました。GPU、CPU、ネットワーク、ソフトウェア、電力供給、冷却システム間の相乗効果を最適化することで、生成トークン100万個あたりのコストを削減することに成功しました。この改善は、個人消費者から大企業まで、様々なタスクにAIを活用するユーザーの増加に伴い、特に大きなメリットをもたらします。

NVIDIAの進歩はソフトウェアスタックにも及び、既存プラットフォームからより高いパフォーマンスを引き出せるよう微調整されています。この戦略は、NVIDIA GPUの性能を向上させるだけでなく、クラウドサービスプロバイダー、GPUクラウド、モデルビルダー、そして企業全体で既に導入されているインフラストラクチャの生産寿命を延ばすことにもつながります。

NVIDIAの推論ソフトウェアスタックへの最近のアップデートは、特にNVIDIA Blackwellアーキテクチャ上で実行する場合、大幅なパフォーマンス向上をもたらしました。これらのアップデートは、ソフトウェアスタックの全機能と相まって、洗練されたスパース混合エキスパート推論モデルであるDeepSeek-R1のパフォーマンス向上に大きく貢献しました。

72基のNVIDIA Blackwell GPUを搭載したNVIDIA GB200 NVL72ラックスケールプラットフォームは、AIパフォーマンスの最適化に対するNVIDIAのコミットメントを示すものです。このプラットフォームの設計は、頻繁なデータ交換を必要とするスパースMoEアーキテクチャに基づくモデル向けにカスタマイズされています。BlackwellアーキテクチャのNVFP4データ形式向けハードウェアアクセラレーションや、分散型サービングなどの最適化により、NVL72アーキテクチャとNVLinkスイッチテクノロジーがさらに活用され、DeepSeek-R1などのモデルで最高レベルのパフォーマンスを実現します。

この記事を共有:

最新のニュース
オークファンMCPサーバー開始AI支援

オークファンMCPサーバー開始AI支援

26/1/14 0:00

オークファン(東京都品川区)は、相場検索サイト「aucfan.com」でMCPサーバーを開始した。

Patsnap知財実務AIベンチマーク公開

Patsnap知財実務AIベンチマーク公開

26/1/14 0:00

Patsnap(シンガポール)は、知財実務に特化したベンチマーク「PatentBench」を構築した。

FiberMall、400G、800G光トランシーバーを発売

FiberMall、400G、800G光トランシーバーを発売

26/1/14 0:00

中国・深圳発 – FiberMallは、AI分野の高速接続ニーズを満たすよう設計された400Gおよび800G光トランシーバーの量産と出荷を開始しました。

KunlunMeta、GPT-Station AIモバイル端末を発表

KunlunMeta、GPT-Station AIモバイル端末を発表

26/1/14 0:00

ラスベガス、2026年1月9日 – ラスベガスで開催されているコンシューマー・エレクトロニクス・ショー(CES)は、人工知能(AI)の最新技術を披露する場となり、中国のスタートアップ企業KunlunMetaが注目を集めました。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
オークファンMCPサーバー開始AI支援

オークファンMCPサーバー開始AI支援

26/1/14 0:00

オークファン(東京都品川区)は、相場検索サイト「aucfan.com」でMCPサーバーを開始した。

Patsnap知財実務AIベンチマーク公開

Patsnap知財実務AIベンチマーク公開

26/1/14 0:00

Patsnap(シンガポール)は、知財実務に特化したベンチマーク「PatentBench」を構築した。

FiberMall、400G、800G光トランシーバーを発売

FiberMall、400G、800G光トランシーバーを発売

26/1/14 0:00

中国・深圳発 – FiberMallは、AI分野の高速接続ニーズを満たすよう設計された400Gおよび800G光トランシーバーの量産と出荷を開始しました。

KunlunMeta、GPT-Station AIモバイル端末を発表

KunlunMeta、GPT-Station AIモバイル端末を発表

26/1/14 0:00

ラスベガス、2026年1月9日 – ラスベガスで開催されているコンシューマー・エレクトロニクス・ショー(CES)は、人工知能(AI)の最新技術を披露する場となり、中国のスタートアップ企業KunlunMetaが注目を集めました。

bottom of page