top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA NIM Operator 3.0.0 が Kubernetes AI 管理を強化

Generatived

25/9/12 0:00

NVIDIAは、Kubernetes環境におけるAI推論パイプラインの管理を強化するツール、NIM Operator 3.0.0を発表しました。最新バージョンは、リソースの効率的な利用と既存のKubernetesインフラストラクチャとの互換性に重点を置き、NVIDIA NIMおよびNeMoマイクロサービスの導入を効率化することを目指しています。NIM Operatorは、高度なAIモデルの実行に必要な複雑なソフトウェアコンポーネントの運用を担うクラスター管理者にとって特に有益です。

同社はRed Hatとの協業により、KServeへのNIMデプロイメントの統合を実現しました。これにより、NIMマイクロサービスのスケーラブルなデプロイメントが簡素化されます。Red Hatのエンジニアリングチームはこのオープンソースプロジェクトに貢献し、NIM OperatorがKServeのライフサイクル管理とモデルキャッシュ機能を活用できるようにしました。この協業により、NeMo Guardrailsを通じてKServe推論エンドポイント全体に信頼できるAIが提供され、ユーザーエクスペリエンスが向上することが期待されます。

NVIDIAのお客様とパートナーは、NIM Operatorを活用して、多様なアプリケーションとAIエージェントを効果的に管理してきました。このツールは、チャットボット、エージェント型RAG、仮想創薬などで使用されるAIモデルを含む、幅広いAIモデルをサポートしています。NIM Operator 3.0.0のリリースにより、ユーザーはマルチLLM対応およびマルチノードNIMをより効率的に導入し、動的リソース割り当て(DRA)などの機能を活用してGPU管理を改善できるようになりました。

NIM Operator 3.0.0は、企業におけるAIワークフローの導入を促進するためのNVIDIAの広範な取り組みの一環です。NVIDIA AI Blueprintsと連携し、AIアプリケーションの本番環境への移行を簡素化することを目指しています。このツールは、NGCまたはNVIDIA/k8s-nim-operator GitHubリポジトリから入手でき、企業向けサポートと技術支援リソースも提供されます。

この記事を共有:

最新のニュース
Google Cloud の新しい Spark トラブルシューティング ツール

Google Cloud の新しい Spark トラブルシューティング ツール

25/9/12 0:00

Google Cloud(アメリカ カリフォルニア州)は、Apache Sparkのトラブルシューティングを支援する新ツール「Gemini Cloud Assist Investigations」の公開プレビュー版をリリースした。

マイクロソフト 大阪AI行政サービス サポート

マイクロソフト 大阪AI行政サービス サポート

25/9/12 0:00

マイクロソフト(大阪)は、大阪府(大阪)と協力し、AIエージェントを用いた行政サービスの向上を目指す新プロジェクトを発表。

NVIDIA RTX PRO 6000がタンパク質構造推論を加速

NVIDIA RTX PRO 6000がタンパク質構造推論を加速

25/9/12 0:00

NVIDIAは、タンパク質構造推論の速度を大幅に向上させるRTX PRO 6000 Blackwell Server Edition GPUを発表しました。

Google Cloud、効率的なAI導入方法を発表

Google Cloud、効率的なAI導入方法を発表

25/9/12 0:00

Google Cloudは、従来のGPUベースのサービスアーキテクチャの課題に対処し、AIモデルをより効率的にデプロイするための新しいソリューションを発表しました。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
Google Cloud の新しい Spark トラブルシューティング ツール

Google Cloud の新しい Spark トラブルシューティング ツール

25/9/12 0:00

Google Cloud(アメリカ カリフォルニア州)は、Apache Sparkのトラブルシューティングを支援する新ツール「Gemini Cloud Assist Investigations」の公開プレビュー版をリリースした。

マイクロソフト 大阪AI行政サービス サポート

マイクロソフト 大阪AI行政サービス サポート

25/9/12 0:00

マイクロソフト(大阪)は、大阪府(大阪)と協力し、AIエージェントを用いた行政サービスの向上を目指す新プロジェクトを発表。

NVIDIA RTX PRO 6000がタンパク質構造推論を加速

NVIDIA RTX PRO 6000がタンパク質構造推論を加速

25/9/12 0:00

NVIDIAは、タンパク質構造推論の速度を大幅に向上させるRTX PRO 6000 Blackwell Server Edition GPUを発表しました。

Google Cloud、効率的なAI導入方法を発表

Google Cloud、効率的なAI導入方法を発表

25/9/12 0:00

Google Cloudは、従来のGPUベースのサービスアーキテクチャの課題に対処し、AIモデルをより効率的にデプロイするための新しいソリューションを発表しました。

bottom of page