top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA トークンコスト重視のAI基盤戦略

Generatived

26/4/20 0:00

NVIDIA(米国カリフォルニア州)は、AI時代におけるデータセンターの役割が変化し、トークン生成を担う「AIトークン工場」へ進化しているとの見解を示した。推論処理が主用途となり、出力価値の指標が重要になるとされる。

同社によれば、従来の評価指標である計算コストやFLOPSではなく、「コスト・パー・トークン」が重要な経済指標になるという。これはハードウェア性能やソフトウェア最適化、実運用効率を含む総合的な指標と位置付けられる。

さらに、トークン生成量の最大化がコスト低減と収益拡大の双方に寄与すると分析。特に大規模推論モデルでは、電力あたりのトークン出力や分散処理性能などが実運用の成果を左右する要因になるとした。

同社の比較では、最新世代のBlackwellが従来のHopperに比べて大幅にトークン効率を高め、結果としてトークン単価を大きく低減する傾向が確認されたという。今後は出力指標を基軸としたインフラ評価が求められるとしている。

この記事を共有:

最新のニュース
NVIDIA、通信網�自律化基盤を展開

NVIDIA、通信網自律化基盤を展開

26/6/25 0:00

NVIDIA(米カリフォルニア州サンタクララ)は、通信事業者向けの自律ネットワーク実現に向けたAI基盤をTM Forum DTW Ignite 2026で紹介した。

NVIDIA、DFlashで推論性能向上

NVIDIA、DFlashで推論性能向上

26/6/25 0:00

NVIDIA(米カリフォルニア州サンタクララ)は、推論高速化技術「DFlash」の活用により、大規模言語モデルの推論性能を大幅に向上できると発表した。

NVIDIA、BioNeMoでAI科学者支援

NVIDIA、BioNeMoでAI科学者支援

26/6/25 0:00

NVIDIA(米カリフォルニア州サンタクララ)は、AIエージェントが生命科学研究を実行するための基盤として「BioNeMo」を提供していると発表した。

WalkersがAI実践コミュニティ開始

WalkersがAI実践コミュニティ開始

26/6/25 0:00

Walkers(東京都)は、AI時代に事業開発や業務への生成AI活用を実践したいビジネスパーソン向けコミュニティ「ハコブネ」の提供を開始したと発表した。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
NVIDIA、通信網自律化基盤を展開

NVIDIA、通信網自律化基盤を展開

26/6/25 0:00

NVIDIA(米カリフォルニア州サンタクララ)は、通信事業者向けの自律ネットワーク実現に向けたAI基盤をTM Forum DTW Ignite 2026で紹介した。

NVIDIA、DFlashで推論性能向上

NVIDIA、DFlashで推論性能向上

26/6/25 0:00

NVIDIA(米カリフォルニア州サンタクララ)は、推論高速化技術「DFlash」の活用により、大規模言語モデルの推論性能を大幅に向上できると発表した。

NVIDIA、BioNeMoでAI科学者支援

NVIDIA、BioNeMoでAI科学者支援

26/6/25 0:00

NVIDIA(米カリフォルニア州サンタクララ)は、AIエージェントが生命科学研究を実行するための基盤として「BioNeMo」を提供していると発表した。

WalkersがAI実践コミュニティ開始

WalkersがAI実践コミュニティ開始

26/6/25 0:00

Walkers(東京都)は、AI時代に事業開発や業務への生成AI活用を実践したいビジネスパーソン向けコミュニティ「ハコブネ」の提供を開始したと発表した。

bottom of page