top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA、マルチタスクユーザー向けに AI-Q エージェントを拡張

Generatived

25/8/29 0:00

複数のユーザーを同時に処理できるAIエージェントの導入は、その実用化において重要なステップです。AI-Q NVIDIA Blueprintを使用して開発されたディープリサーチエージェントは、NVIDIA NeMo Agent Toolkitを使用して実用化に向けてスケールアップされました。このツールキットは、エージェントが多数のユーザーをサポートできるようにするために必要なツールと技術を提供しました。

AI-QリサーチエージェントはLangGraphアプリケーションであり、ユーザーはドキュメントのアップロード、メタデータの抽出、内部データソースへのアクセス、そしてウェブ検索による調査レポートの作成が可能です。このエージェントのアーキテクチャは、NVIDIA NeMo Retrieverモデルと内部OpenShiftクラスターを活用し、スケーラブルに設計されています。今回の導入では、様々なチームにまたがる数百人のユーザーをサポートするために拡張が必要な​​システムコンポーネントの特定に重点が置かれました。

エージェントのパフォーマンスが複数ユーザーの要求を満たすことを保証するために、3段階のプロセスを採用しました。まず、単一ユーザーを対象にアプリケーションのプロファイリングを行い、ボトルネックを特定しました。次に、数百ユーザー規模の環境に必要なアーキテクチャを推定するために負荷テストを実施しました。最後に、段階的なロールアウト中にアプリケーションを監視し、パフォーマンスを観察して必要な最適化を行いました。

NeMoエージェントツールキットは、エージェントのパフォーマンスのプロファイリングと最適化において重要な役割を果たしました。評価およびプロファイリングシステム、負荷テスト用のサイジングツール、そしてロールアウト中のモニタリングのためのOpenTelemetryコレクターを提供しました。これらのツールにより、ボトルネックやバグの特定と修正が可能になり、エージェントは調査レポートの品質を維持しながら、多くのユーザーに迅速かつ応答性の高いサービスを提供できるようになりました。AI-Q調査エージェントの導入成功は、このツールキットがAIアプリケーションの本番環境への拡張に有効であることを示しています。

この記事を共有:

最新のニュース
SREホールディングス不動産AI新機能

SREホールディングス不動産AI新機能

26/3/5 0:00

SREホールディングス(東京都港区)は、不動産AI査定サービス「SRE AI査定CLOUD」に新たな「金融機関パッケージ」を追加した。

エムニ支援エステーDX成功事例

エムニ支援エステーDX成功事例

26/3/5 0:00

エムニ(東京都千代田区)は、エステー(東京都新宿区)のDX推進を支援し、その成果としてユーザーインタビュー記事2本を公開した。

ギブリー「MANA Studio」最新AI対応

ギブリー「MANA Studio」最新AI対応

26/3/5 0:00

ギブリー(東京都渋谷区)は、生成AI・AIエージェント活用プラットフォーム「MANA Studio」をアップデートし、米Google社の「Gemini 3 Flash」「Gemini 3.1 Pro」、米Anthropic社の「Claude Opus 4.6」「Claude Sonnet 4.6」シリーズへの対応を完了したと発表。

チェック・ポイントCPR AI脆弱性発見

チェック・ポイントCPR AI脆弱性発見

26/3/5 0:00

チェック・ポイント(米国)は、同社の脅威インテリジェンス部門CPRが、Anthropic社のAIコーディングアシスタント「Claude Code」に重大な脆弱性があったことを発表。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
SREホールディングス不動産AI新機能

SREホールディングス不動産AI新機能

26/3/5 0:00

SREホールディングス(東京都港区)は、不動産AI査定サービス「SRE AI査定CLOUD」に新たな「金融機関パッケージ」を追加した。

エムニ支援エステーDX成功事例

エムニ支援エステーDX成功事例

26/3/5 0:00

エムニ(東京都千代田区)は、エステー(東京都新宿区)のDX推進を支援し、その成果としてユーザーインタビュー記事2本を公開した。

ギブリー「MANA Studio」最新AI対応

ギブリー「MANA Studio」最新AI対応

26/3/5 0:00

ギブリー(東京都渋谷区)は、生成AI・AIエージェント活用プラットフォーム「MANA Studio」をアップデートし、米Google社の「Gemini 3 Flash」「Gemini 3.1 Pro」、米Anthropic社の「Claude Opus 4.6」「Claude Sonnet 4.6」シリーズへの対応を完了したと発表。

チェック・ポイントCPR AI脆弱性発見

チェック・ポイントCPR AI脆弱性発見

26/3/5 0:00

チェック・ポイント(米国)は、同社の脅威インテリジェンス部門CPRが、Anthropic社のAIコーディングアシスタント「Claude Code」に重大な脆弱性があったことを発表。

bottom of page