Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

NVIDIA、マルチタスクユーザー向けに AI-Q エージェントを拡張
Generatived
25/8/29 0:00
複数のユーザーを同時に処理できるAIエージェントの導入は、その実用化において重要なステップです。AI-Q NVIDIA Blueprintを使用して開発されたディープリサーチエージェントは、NVIDIA NeMo Agent Toolkitを使用して実用化に向けてスケールアップされました。このツールキットは、エージェントが多数のユーザーをサポートできるようにするために必要なツールと技術を提供しました。
AI-QリサーチエージェントはLangGraphアプリケーションであり、ユーザーはドキュメントのアップロード、メタデータの抽出、内部データソースへのアクセス、そしてウェブ検索による調査レポートの作成が可能です。このエージェントのアーキテクチャは、NVIDIA NeMo Retrieverモデルと内部OpenShiftクラスターを活用し、スケーラブルに設計されています。今回の導入では、様々なチームにまたがる数百人のユーザーをサポートするために拡張が必要なシステムコンポーネントの特定に重点が置かれました。
エージェントのパフォーマンスが複数ユーザーの要求を満たすことを保証するために、3段階のプロセスを採用しました。まず、単一ユーザーを対象にアプリケーションのプロファイリングを行い、ボトルネックを特定しました。次に、数百ユーザー規模の環境に必要なアーキテクチャを推定するために負荷テストを実施しました。最後に、段階的なロールアウト中にアプリケーションを監視し、パフォーマンスを観察して必要な最適化を行いました。
NeMoエージェントツールキットは、エージェントのパフォーマンスのプロファイリングと最適化において重要な役割を果たしました。評価およびプロファイリングシステム、負荷テスト用のサイジングツール、そしてロールアウト中のモニタリングのためのOpenTelemetryコレクターを提供しました。これらのツールにより、ボトルネックやバグの特定と修正が可能になり、エージェントは調査レポートの品質を維持しながら、多くのユーザーに迅速かつ応答性の高いサービスを提供できるようになりました。AI-Q調査エージェントの導入成功は、このツールキットがAIアプリケーションの本番環境への拡張に有効であることを示しています。
最新のニュース
スタディストAI新製品Teachme展開
26/3/5 0:00
スタディスト(東京都千代田区)は、企業の生産性向上を目指す「リーンオペレーション」の実現を支援するフレームワーク「9つのステップ」を策定した。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
スタディストAI新製品Teachme展開
26/3/5 0:00
スタディスト(東京都千代田区)は、企業の生産性向上を目指す「リーンオペレーション」の実現を支援するフレームワーク「9つのステップ」を策定した。



%20(1).webp)


