Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
%20(1).webp)
NVIDIAがエージェントAI基盤強化
Generatived
26/5/8 0:00
NVIDIA(米カリフォルニア州)は、生成AIがチャットボット中心の利用から、自律的にツールやサブエージェントを活用する「Agentic AI」へ移行しているとの分析を公表した。トークン消費量や長文コンテキスト需要が急増しているという。
同社によると、エージェント型AIは従来型チャット比で最大15倍のトークンを消費するケースがある。複数のツール呼び出しやサブエージェント処理、コンテキスト圧縮などが加わることで、推論コストやレイテンシー要件が大幅に高まるとしている。
また、長大なコンテキスト処理を支える基盤として「Vera Rubin NVL72」や「Groq 3 LPX」、NVLink 6、BlueField-4などを組み合わせた極限協調設計(Extreme Co-Design)戦略を紹介した。大規模MoEモデル向け推論効率改善を狙う。
さらに、DynamoやTRT-LLM WideEP、Speculative Decodingなどのソフトウェア群も公開した。400Kコンテキスト規模でも毎秒400超のトークン生成性能を目指し、エージェントAIの実用化加速につなげる考えを示した。
最新のニュース
トランスコスモス韓国新拠点開設
26/6/24 0:00
トランスコスモス(東京都豊島区)は、韓国ソウル市の新興ビジネスエリア・マゴクに、新たなオペレーション拠点「CXスクエア マゴク」を開設したと発表した。
AI NativeがAI開発力診断公開
26/6/24 0:00
AI Native(東京都渋谷区)は、エンジニアやプロジェクトマネージャー向けに、AI時代の開発スキルを9軸で可視化する無料診断ツール「AI開発力スキル診断」を公開したと発表した。
デザインLがスマホ係提供開始
26/6/24 0:00
合同会社デザインL(東京都豊島区)は、シニア世代のスマートフォンに関する相談へAIがLINE上で対応する新サービス「スマホ係」の提供を開始したと発表した。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
トランスコスモス韓国新拠点開設
26/6/24 0:00
トランスコスモス(東京都豊島区)は、韓国ソウル市の新興ビジネスエリア・マゴクに、新たなオペレーション拠点「CXスクエア マゴク」を開設したと発表した。
AI NativeがAI開発力診断公開
26/6/24 0:00
AI Native(東京都渋谷区)は、エンジニアやプロジェクトマネージャー向けに、AI時代の開発スキルを9軸で可視化する無料診断ツール「AI開発力スキル診断」を公開したと発表した。
デザインLがスマホ係提供開始
26/6/24 0:00
合同会社デザインL(東京都豊島区)は、シニア世代のスマートフォンに関する相談へAIがLINE上で対応する新サービス「スマホ係」の提供を開始したと発表した。

%20(1).webp)
%20(1).webp)
%20(1).webp)


