top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIAがエージェントAI基盤強化

Generatived

26/5/8 0:00

NVIDIA(米カリフォルニア州)は、生成AIがチャットボット中心の利用から、自律的にツールやサブエージェントを活用する「Agentic AI」へ移行しているとの分析を公表した。トークン消費量や長文コンテキスト需要が急増しているという。

同社によると、エージェント型AIは従来型チャット比で最大15倍のトークンを消費するケースがある。複数のツール呼び出しやサブエージェント処理、コンテキスト圧縮などが加わることで、推論コストやレイテンシー要件が大幅に高まるとしている。

また、長大なコンテキスト処理を支える基盤として「Vera Rubin NVL72」や「Groq 3 LPX」、NVLink 6、BlueField-4などを組み合わせた極限協調設計(Extreme Co-Design)戦略を紹介した。大規模MoEモデル向け推論効率改善を狙う。

さらに、DynamoやTRT-LLM WideEP、Speculative Decodingなどのソフトウェア群も公開した。400Kコンテキスト規模でも毎秒400超のトークン生成性能を目指し、エージェントAIの実用化加速につなげる考えを示した。

この記事を共有:

最新のニュース
NVIDIA、MRC対応AIネット強化

NVIDIA、MRC対応AIネット強化

26/5/7 0:00

NVIDIA(米国カリフォルニア州)は、AI向けネットワーク基盤「Spectrum-X Ethernet」において、RDMA転送プロトコル「Multipath Reliable Connection(MRC)」を活用した大規模AIインフラ展開を進めていると発表した。

Uber、OpenAI活用で音声AI強化

Uber、OpenAI活用で音声AI強化

26/5/7 0:00

Uber(米国・カリフォルニア州)は、OpenAIの大規模言語モデルを活用し、ドライバー向けAI支援機能や音声インターフェースを拡充したと発表した。

OpenAI、ChatGPT広告機能拡充

OpenAI、ChatGPT広告機能拡充

26/5/7 0:00

OpenAI(米国・カリフォルニア州)は、ChatGPT広告パイロットの次段階として、広告主向け機能を拡充したと発表した。

OpenAI、企業AI活用調査公開

OpenAI、企業AI活用調査公開

26/5/7 0:00

OpenAI(米国・カリフォルニア州)は、企業向けAI利用動向を分析する「B2B Signals」を発表した。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
NVIDIA、MRC対応AIネット強化

NVIDIA、MRC対応AIネット強化

26/5/7 0:00

NVIDIA(米国カリフォルニア州)は、AI向けネットワーク基盤「Spectrum-X Ethernet」において、RDMA転送プロトコル「Multipath Reliable Connection(MRC)」を活用した大規模AIインフラ展開を進めていると発表した。

Uber、OpenAI活用で音声AI強化

Uber、OpenAI活用で音声AI強化

26/5/7 0:00

Uber(米国・カリフォルニア州)は、OpenAIの大規模言語モデルを活用し、ドライバー向けAI支援機能や音声インターフェースを拡充したと発表した。

OpenAI、ChatGPT広告機能拡充

OpenAI、ChatGPT広告機能拡充

26/5/7 0:00

OpenAI(米国・カリフォルニア州)は、ChatGPT広告パイロットの次段階として、広告主向け機能を拡充したと発表した。

OpenAI、企業AI活用調査公開

OpenAI、企業AI活用調査公開

26/5/7 0:00

OpenAI(米国・カリフォルニア州)は、企業向けAI利用動向を分析する「B2B Signals」を発表した。

bottom of page