top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIAがエージェント型AIシステム向けGroq 3 LPXを発表

Generatived

26/3/18 0:00

NVIDIAは、エージェントシステムのニーズに合わせて設計された新しいラック規模の推論アクセラレータ「Groq 3 LPX」を発表しました。LPXはNVIDIA Vera Rubin NVL72と連携して動作するように設計されており、低レーテンシーを必要とするAIアプリケーションに不可欠な高速トークン生成のための専用エンジンを提供します。一方、Vera Rubin NVL72は、トレーニングと推論の両方のタスクに対応する汎用性の高いソリューションとして引き続き機能し、幅広い処理を高スループットで処理できます。

Vera Rubin NVL72とLPXの連携は、エージェント型AIの未来にとって極めて重要です。エージェント型AIでは、ユーザー1人あたり毎秒最大1,000トークンのインタラクション速度が期待されています。この高速化により、AIシステムは継続的な推論、シミュレーション、応答を行うことが可能になり、ターン制のコミュニケーションではなく、リアルタイムのコラボレーションをシミュレートできます。また、エージェントグループを連携させる能力は、人間社会が集合知を活用するのと同様に、複雑なタスクを実行する可能性を高めます。

これらのシステムの高度な要件をサポートするには、高いスループットと低レーテンシーの両方を実現できる堅牢なインフラストラクチャが必要です。Vera Rubin NVL72とLPXを組み合わせたヘテロジニアスアーキテクチャは、大規模AIファクトリーのパフォーマンスと、継続的に稼働するエージェントシステムや最先端の​​AIアプリケーションに必要な迅速なトークン生成を両立させることで、このニーズを満たします。

NVIDIA Groq 3 LPXシステムは、相互接続された256個のアクセラレータを中心に構築されており、決定論的な実行と高いオンチップSRAM帯域幅を重視しています。この設計により、対話型推論は、並列処理レベルや要求の複雑さが変化する状況下でも応答性を維持します。Vera Rubin NVL72と連携して展開した場合、LPXは特にデコードループのレイテンシに敏感な部分を高速化し、Rubin GPUはプリフィルとデコードアテンションを管理します。これにより、AIファクトリーのスループットを損なうことなく対話型応答性を向上させる異種混在型のサービングパスが実現します。

この記事を共有:

最新のニュース
Crown Cat AIチャットボット事業譲受

Crown Cat AIチャットボット事業譲受

26/3/18 0:00

Crown Cat(東京都渋谷区)は、生成AIチャットボットサービス「Smart Search」の事業を2026年2月20日に譲受。

エクサウィザーズexaBase日本リージョン開始

エクサウィザーズexaBase日本リージョン開始

26/3/18 0:00

エクサウィザーズ(東京都港区)のグループ会社Exa Enterprise AIは、法人向け生成AIサービス「exaBase 生成AI」で「GPT-5.2」の日本リージョン提供を開始した。

invox読取AIエージェント機能追加

invox読取AIエージェント機能追加

26/3/18 0:00

invox(東京都新宿区)は、「invox電子帳簿保存」にAIを活用した「読み取りAIエージェント」機能を追加した。

Polaris.AI AWS支援で製造業AI強化

Polaris.AI AWS支援で製造業AI強化

26/3/18 0:00

Polaris.AI(東京都港区)は、「フィジカル AI 開発支援プログラム by AWS ジャパン」への採択を発表。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
Crown Cat AIチャットボット事業譲受

Crown Cat AIチャットボット事業譲受

26/3/18 0:00

Crown Cat(東京都渋谷区)は、生成AIチャットボットサービス「Smart Search」の事業を2026年2月20日に譲受。

エクサウィザーズexaBase日本リージョン開始

エクサウィザーズexaBase日本リージョン開始

26/3/18 0:00

エクサウィザーズ(東京都港区)のグループ会社Exa Enterprise AIは、法人向け生成AIサービス「exaBase 生成AI」で「GPT-5.2」の日本リージョン提供を開始した。

invox読取AIエージェント機能追加

invox読取AIエージェント機能追加

26/3/18 0:00

invox(東京都新宿区)は、「invox電子帳簿保存」にAIを活用した「読み取りAIエージェント」機能を追加した。

Polaris.AI AWS支援で製造業AI強化

Polaris.AI AWS支援で製造業AI強化

26/3/18 0:00

Polaris.AI(東京都港区)は、「フィジカル AI 開発支援プログラム by AWS ジャパン」への採択を発表。

bottom of page