top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA NIM Operator 2.0 が Kubernetes AI の展開を強化

Generatived

25/5/1 0:00

NVIDIAは、Kubernetesクラスター上でのAI推論パイプラインの導入と管理を簡素化するツール「NIM Operator」の機能を強化しました。NIM Operatorの初期リリースでは、NIMマイクロサービスの迅速な導入、自動スケーリング、アップデートを可能にすることで、MLOpsおよびKubernetes管理者の作業負荷を軽減することに重点が置かれていました。このツールは、チャットボットから仮想創薬まで、幅広いアプリケーションの管理において、お客様やパートナーの皆様に多大なる貢献を果たしてきました。

Cisco Systemsのコンピューティング ソリューション チームは、NIM Operator を自社のAI インフラストラクチャに統合し、NVIDIA AI ブループリントを活用して、検索拡張型生成パイプラインを構築しました。Cisco Cisco Systemsの Paniraja Koppa 氏によると、NIM Operator は効率的なモデル キャッシュと NIM サービスの統合管理を通じて、導入プロセスを大幅に効率化し、AI アプリケーションのパフォーマンスを向上させました。

最新アップデートであるNVIDIA NIM Operator 2.0では、AIワークフローの構築に不可欠なNVIDIA NeMoマイクロサービスのデプロイメントとライフサイクル管理が導入されています。このアップデートには、NeMo Customizer、Evaluator、Guardrails用の新しいKubernetesカスタムリソース定義(CRD)が含まれており、それぞれ言語モデルの微調整を容易にし、包括的な評価機能を提供し、LLMエンドポイントに安全性チェックを追加します。

AIワークフローの導入を簡素化するというNVIDIAの取り組みは、NIM Operatorの機能に明確に表れています。NIM Operatorは、ローリングアップグレード、イングレス構成、自動スケーリングといったDay 2運用の容易な管理をサポートします。NIM Operatorは、エンタープライズサポートとプロアクティブなセキュリティパッチ適用を提供するNVIDIA AI Enterpriseの一部であり、NGCまたはGitHubから入手できます。

この記事を共有:

最新のニュース
LegalOn 法務AI性能ベンチマーク公開

LegalOn 法務AI性能ベンチマーク公開

25/12/17 0:00

LegalOn Technologies(東京都渋谷区)は、企業法務実務に特化した大規模言語モデルの性能を評価する「Legal Rikai: Open Benchmark」を公開した。

TechSuite前田道路新卒採用支援

TechSuite前田道路新卒採用支援

25/12/17 0:00

TechSuite(東京)は、前田道路(東京)の新卒採用を支援するため、「AIスカウトくん」を提供した。

アクロクエストAIエージェント開発講演

アクロクエストAIエージェント開発講演

25/12/17 0:00

アクロクエスト(神奈川県横浜市)は、2025年12月20日に開催される「JAWS-UG Presents - AI Builders Day」に参加する。

ギブリーAIモニタリング開始

ギブリーAIモニタリング開始

25/12/17 0:00

ギブリー(東京都渋谷区)は、企業内の生成AI利用を可視化する「Givery AI Monitoring」の提供を開始。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
LegalOn 法務AI性能ベンチマーク公開

LegalOn 法務AI性能ベンチマーク公開

25/12/17 0:00

LegalOn Technologies(東京都渋谷区)は、企業法務実務に特化した大規模言語モデルの性能を評価する「Legal Rikai: Open Benchmark」を公開した。

TechSuite前田道路新卒採用支援

TechSuite前田道路新卒採用支援

25/12/17 0:00

TechSuite(東京)は、前田道路(東京)の新卒採用を支援するため、「AIスカウトくん」を提供した。

アクロクエストAIエージェント開発講演

アクロクエストAIエージェント開発講演

25/12/17 0:00

アクロクエスト(神奈川県横浜市)は、2025年12月20日に開催される「JAWS-UG Presents - AI Builders Day」に参加する。

ギブリーAIモニタリング開始

ギブリーAIモニタリング開始

25/12/17 0:00

ギブリー(東京都渋谷区)は、企業内の生成AI利用を可視化する「Givery AI Monitoring」の提供を開始。

bottom of page