top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA NIM Operator 2.0 が Kubernetes AI の展開を強化

Generatived

25/5/1 0:00

NVIDIAは、Kubernetesクラスター上でのAI推論パイプラインの導入と管理を簡素化するツール「NIM Operator」の機能を強化しました。NIM Operatorの初期リリースでは、NIMマイクロサービスの迅速な導入、自動スケーリング、アップデートを可能にすることで、MLOpsおよびKubernetes管理者の作業負荷を軽減することに重点が置かれていました。このツールは、チャットボットから仮想創薬まで、幅広いアプリケーションの管理において、お客様やパートナーの皆様に多大なる貢献を果たしてきました。

Cisco Systemsのコンピューティング ソリューション チームは、NIM Operator を自社のAI インフラストラクチャに統合し、NVIDIA AI ブループリントを活用して、検索拡張型生成パイプラインを構築しました。Cisco Cisco Systemsの Paniraja Koppa 氏によると、NIM Operator は効率的なモデル キャッシュと NIM サービスの統合管理を通じて、導入プロセスを大幅に効率化し、AI アプリケーションのパフォーマンスを向上させました。

最新アップデートであるNVIDIA NIM Operator 2.0では、AIワークフローの構築に不可欠なNVIDIA NeMoマイクロサービスのデプロイメントとライフサイクル管理が導入されています。このアップデートには、NeMo Customizer、Evaluator、Guardrails用の新しいKubernetesカスタムリソース定義(CRD)が含まれており、それぞれ言語モデルの微調整を容易にし、包括的な評価機能を提供し、LLMエンドポイントに安全性チェックを追加します。

AIワークフローの導入を簡素化するというNVIDIAの取り組みは、NIM Operatorの機能に明確に表れています。NIM Operatorは、ローリングアップグレード、イングレス構成、自動スケーリングといったDay 2運用の容易な管理をサポートします。NIM Operatorは、エンタープライズサポートとプロアクティブなセキュリティパッチ適用を提供するNVIDIA AI Enterpriseの一部であり、NGCまたはGitHubから入手できます。

この記事を共有:

最新のニュース
Gemini、 Google AIを活用したカスタムトラック作成を開始

Gemini、 Google AIを活用したカスタムトラック作成を開始

26/2/20 0:00

Geminiは、ユーザーが説明文を入力するか写真をアップロードするだけで、カスタム音楽トラックを作成できる新機能を導入しました。

Google、グローバルAIアクセス強化イニシアチブを発表

Google、グローバルAIアクセス強化イニシアチブを発表

26/2/20 0:00

Googleは、AI技術への世界的なアクセス向上への取り組みを発表し、様々な分野における課題解決のためにこれらのツールが広く利用可能であることの重要性を強調しました。

Sarvam AI と NVIDIA が多言語 AI モデルを加速

Sarvam AI と NVIDIA が多言語 AI モデルを加速

26/2/20 0:00

インド・ベンガルールのAIスタートアップ企業Sarvam AIは、インドの多様な言語ニーズに応えるため、大規模な多言語基盤モデルを構築するという野心的なプロジェクトに着手しました。

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

26/2/20 0:00

NVIDIA は Nebius 社と協力し、大規模言語モデル (LLM) 推論における NVIDIA Run:ai の部分的 GPU 割り当てによるパフォーマンス向上を評価しました。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
Gemini、 Google AIを活用したカスタムトラック作成を開始

Gemini、 Google AIを活用したカスタムトラック作成を開始

26/2/20 0:00

Geminiは、ユーザーが説明文を入力するか写真をアップロードするだけで、カスタム音楽トラックを作成できる新機能を導入しました。

Google、グローバルAIアクセス強化イニシアチブを発表

Google、グローバルAIアクセス強化イニシアチブを発表

26/2/20 0:00

Googleは、AI技術への世界的なアクセス向上への取り組みを発表し、様々な分野における課題解決のためにこれらのツールが広く利用可能であることの重要性を強調しました。

Sarvam AI と NVIDIA が多言語 AI モデルを加速

Sarvam AI と NVIDIA が多言語 AI モデルを加速

26/2/20 0:00

インド・ベンガルールのAIスタートアップ企業Sarvam AIは、インドの多様な言語ニーズに応えるため、大規模な多言語基盤モデルを構築するという野心的なプロジェクトに着手しました。

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

26/2/20 0:00

NVIDIA は Nebius 社と協力し、大規模言語モデル (LLM) 推論における NVIDIA Run:ai の部分的 GPU 割り当てによるパフォーマンス向上を評価しました。

bottom of page