top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA Grove、Kubernetes 上の AI ワークロード管理を強化

Generatived

25/11/12 0:00

AI推論は大きな変革を遂げ、高度なオーケストレーションを必要とする複雑なシステムへと進化しました。AIモデルの展開には、プレフィル、デコード、ビジョンエンコーダなど、複数のコンポーネントが連携してタスクを実行する必要があります。この複雑性により、複数のレプリカを実行するという単純な作業から、これらのコンポーネントを統合されたユニットとして調整することへと焦点が移っています。各要素はそれぞれ独自の構成とリソース要件を持ち、効果的に機能させるには、特定の順序で起動し、ネットワークトポロジ内に配置する必要があります。

こうした高度なシステム管理の複雑な課題に対処するため、NVIDIA は NVIDIA Dynamo に NVIDIA Grove を導入しました。この Kubernetes API は、Kubernetes クラスター上で最新の ML 推論ワークロードの運用を容易にします。オープンソースでGitHubからアクセスできる Grove により、開発者は推論デプロイメントを単一のレプリカからデータセンター規模まで拡張でき、数千台の GPU をサポートします。Grove は推論システム全体を単一のカスタムリソースとして記述する方法を提供し、階層的なギャングスケジューリング、トポロジを考慮した配置、そしてマルチレベルの自動スケーリングを可能にします。

Grove の柔軟性は、単一ノード構成から複雑なエージェントパイプラインまで、様々な現実世界の推論アーキテクチャに対応できることに表れています。開発者は、複雑な AI スタックを、明確かつ宣言的、かつフレームワークに依存しない方法で定義できます。このシステムは、マルチレベルの自動スケーリング、ライフサイクル管理、階層型ギャングスケジューリング、トポロジを考慮したスケジューリングといったニーズに対応し、コンポーネントのオーケストレーションと初期化を確実に実行します。

Grove APIは、階層的なカスタムリソースを用いてマルチコンポーネントAIワークロードを管理し、ロール固有のロジックとマルチレベルのスケーリングを提供します。このアプローチにより、異なるクラスター環境間での最適なデプロイメントが保証されます。Grove対応のKubernetesクラスターは、GroveオペレーターとPodGangリソースを理解するスケジューラーを組み合わせ、ワークロード定義を具体的なスケジューリング制約に変換します。これにより、AIシステムの協調的なデプロイメントが実現され、コンポーネントは正しい順序で起動され、最適なパフォーマンスが得られるように配置され、統一されたグループとして復旧します。

分散型サービスアーキテクチャの導入に関心のある方のために、NVIDIAはDynamoとGroveを使用したステップバイステップガイドを提供しています。NVIDIAはコミュニティの皆様に、Groveの機能を探索し、開発に貢献し、 GitHubまたはDiscordでプロジェクトに参加することを呼びかけています。NVIDIAはまた、すべての貢献者、特にGroveプロジェクトへの多大なサポートと貢献をいただいたSAPに感謝の意を表します。

この記事を共有:

最新のニュース
ロゼッタ歯科AI営業支援ツール発表

ロゼッタ歯科AI営業支援ツール発表

25/11/12 0:00

メタリアル・グループのロゼッタ(東京都)は、歯科クリニック向けのAIエージェント「Metarealデンタルイクイップ」を開発。

もばらぶAIチャットボットプラグイン発表

もばらぶAIチャットボットプラグイン発表

25/11/12 0:00

もばらぶ(東京)は、Amazon Bedrockの生成AIを活用したWordPress用新プラグイン「RAG Chat for Amazon Bedrock」を開発。

AICE金融AIチャットボット発表会

AICE金融AIチャットボット発表会

25/11/12 0:00

AICE(東京都文京区)は、2025年10月20日にCisco(東京都港区)本社で開催された「金融機関様向けCisco AI Roadshow」で、保険・金融業界向けのAIチャットボット基盤について発表した。

LegalOn AIカウンセル渋谷区採択公表

LegalOn AIカウンセル渋谷区採択公表

25/11/12 0:00

LegalOn Technologies(東京都渋谷区)は、AIカウンセル「CorporateOn」が渋谷区の「Testbed City Shibuya」に採択されたと発表。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
ロゼッタ歯科AI営業支援ツール発表

ロゼッタ歯科AI営業支援ツール発表

25/11/12 0:00

メタリアル・グループのロゼッタ(東京都)は、歯科クリニック向けのAIエージェント「Metarealデンタルイクイップ」を開発。

もばらぶAIチャットボットプラグイン発表

もばらぶAIチャットボットプラグイン発表

25/11/12 0:00

もばらぶ(東京)は、Amazon Bedrockの生成AIを活用したWordPress用新プラグイン「RAG Chat for Amazon Bedrock」を開発。

AICE金融AIチャットボット発表会

AICE金融AIチャットボット発表会

25/11/12 0:00

AICE(東京都文京区)は、2025年10月20日にCisco(東京都港区)本社で開催された「金融機関様向けCisco AI Roadshow」で、保険・金融業界向けのAIチャットボット基盤について発表した。

LegalOn AIカウンセル渋谷区採択公表

LegalOn AIカウンセル渋谷区採択公表

25/11/12 0:00

LegalOn Technologies(東京都渋谷区)は、AIカウンセル「CorporateOn」が渋谷区の「Testbed City Shibuya」に採択されたと発表。

bottom of page