top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

NVIDIA NIM Operator 2.0 Meningkatkan Penerapan AI Kubernetes

Generatived

1/5/25, 00.00

NVIDIA telah meningkatkan kemampuan NIM Operator, sebuah alat yang menyederhanakan penerapan dan pengelolaan jalur inferensi AI pada kluster Kubernetes. Rilis awal NIM Operator difokuskan pada pengurangan beban kerja MLOps dan administrator Kubernetes dengan memungkinkan penerapan cepat, penskalaan otomatis, dan pembaruan layanan mikro NIM. Alat ini sangat membantu pelanggan dan mitra dalam mengelola berbagai aplikasi, mulai dari chatbot hingga penemuan obat virtual.

Tim Solusi Komputasi Cisco Systems mengintegrasikan Operator NIM ke dalam infrastruktur AI mereka dan memanfaatkan NVIDIA AI Blueprints untuk membangun jaringan pembangkitan yang dilengkapi pencarian. Menurut Paniraja Koppa dari Cisco Systems, Operator NIM telah menyederhanakan proses penerapan secara signifikan dan meningkatkan kinerja aplikasi AI melalui penyimpanan data model yang efisien dan manajemen layanan NIM yang terpadu.

Pembaruan terbaru, NVIDIA NIM Operator 2.0, memperkenalkan manajemen siklus hidup dan penerapan untuk layanan mikro NVIDIA NeMo yang penting untuk membangun alur kerja AI. Pembaruan ini mencakup definisi sumber daya kustom (CRD) Kubernetes baru untuk NeMo Customizer, Evaluator, dan Guardrails, yang masing-masing memudahkan penyempurnaan model bahasa, menyediakan kemampuan evaluasi yang komprehensif, dan menambahkan pemeriksaan keamanan ke titik akhir LLM.

Komitmen NVIDIA untuk menyederhanakan penerapan alur kerja AI terbukti dalam kemampuan NIM Operator, yang mendukung pengelolaan mudah operasi Hari ke-2 seperti pemutakhiran bergulir, konfigurasi ingress, dan penskalaan otomatis. NIM Operator merupakan bagian dari NVIDIA AI Enterprise, yang menyediakan dukungan perusahaan dan patch keamanan proaktif, dan tersedia di NGC atau GitHub.

Bagikan artikel ini:

Tin tức mới nhất
Gemini、 Google AIを活用したカスタムトラック作成を開始

Gemini、 Google AIを活用したカスタムトラック作成を開始

20/2/26, 00.00

Geminiは、ユーザーが説明文を入力するか写真をアップロードするだけで、カスタム音楽トラックを作成できる新機能を導入しました。

Google、グローバルAIアクセス強化イニシアチブを発表

Google、グローバルAIアクセス強化イニシアチブを発表

20/2/26, 00.00

Googleは、AI技術への世界的なアクセス向上への取り組みを発表し、様々な分野における課題解決のためにこれらのツールが広く利用可能であることの重要性を強調しました。

Sarvam AI と NVIDIA が多言語 AI モデルを加速

Sarvam AI と NVIDIA が多言語 AI モデルを加速

20/2/26, 00.00

インド・ベンガルールのAIスタートアップ企業Sarvam AIは、インドの多様な言語ニーズに応えるため、大規模な多言語基盤モデルを構築するという野心的なプロジェクトに着手しました。

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

20/2/26, 00.00

NVIDIA は Nebius 社と協力し、大規模言語モデル (LLM) 推論における NVIDIA Run:ai の部分的 GPU 割り当てによるパフォーマンス向上を評価しました。

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Gemini、 Google AIを活用したカスタムトラック作成を開始

Gemini、 Google AIを活用したカスタムトラック作成を開始

20/2/26, 00.00

Geminiは、ユーザーが説明文を入力するか写真をアップロードするだけで、カスタム音楽トラックを作成できる新機能を導入しました。

Google、グローバルAIアクセス強化イニシアチブを発表

Google、グローバルAIアクセス強化イニシアチブを発表

20/2/26, 00.00

Googleは、AI技術への世界的なアクセス向上への取り組みを発表し、様々な分野における課題解決のためにこれらのツールが広く利用可能であることの重要性を強調しました。

Sarvam AI と NVIDIA が多言語 AI モデルを加速

Sarvam AI と NVIDIA が多言語 AI モデルを加速

20/2/26, 00.00

インド・ベンガルールのAIスタートアップ企業Sarvam AIは、インドの多様な言語ニーズに応えるため、大規模な多言語基盤モデルを構築するという野心的なプロジェクトに着手しました。

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

20/2/26, 00.00

NVIDIA は Nebius 社と協力し、大規模言語モデル (LLM) 推論における NVIDIA Run:ai の部分的 GPU 割り当てによるパフォーマンス向上を評価しました。

bottom of page