Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA NIM Operator 3.0.0 nâng cao khả năng quản lý AI của Kubernetes
Generatived
0:00 12/9/25
NVIDIA vừa công bố NIM Operator 3.0.0, một công cụ nâng cao khả năng quản lý các luồng suy luận AI trong môi trường Kubernetes. Phiên bản mới nhất này nhằm mục đích hợp lý hóa việc triển khai các dịch vụ vi mô NVIDIA NIM và NeMo, tập trung vào việc sử dụng tài nguyên hiệu quả và khả năng tương thích với cơ sở hạ tầng Kubernetes hiện có. NIM Operator đặc biệt hữu ích cho các quản trị viên cụm chịu trách nhiệm vận hành các thành phần phần mềm phức tạp cần thiết để chạy các mô hình AI tiên tiến.
Công ty đã hợp tác với Red Hat để tích hợp triển khai NIM vào KServe, giúp đơn giản hóa việc triển khai các vi dịch vụ NIM có khả năng mở rộng. Đội ngũ kỹ thuật của Red Hat đã đóng góp vào dự án nguồn mở này, cho phép các Nhà vận hành NIM tận dụng khả năng quản lý vòng đời và lưu trữ mô hình của KServe. Sự hợp tác này được kỳ vọng sẽ cải thiện trải nghiệm người dùng bằng cách cung cấp AI đáng tin cậy trên các điểm cuối suy luận của KServe thông qua NeMo Guardrails.
Khách hàng và đối tác của NVIDIA đã tận dụng NIM Operator để quản lý hiệu quả các ứng dụng và tác nhân AI đa dạng. Công cụ này hỗ trợ nhiều mô hình AI, bao gồm cả những mô hình được sử dụng trong chatbot, RAG dựa trên tác nhân, phát hiện thuốc ảo, v.v. Với việc phát hành NIM Operator 3.0.0, người dùng giờ đây có thể triển khai hiệu quả hơn các NIM đa LLM và đa nút, đồng thời tận dụng các tính năng như phân bổ tài nguyên động (DRA) để cải thiện khả năng quản lý GPU.
NIM Operator 3.0.0 là một phần trong nỗ lực rộng lớn hơn của NVIDIA nhằm đẩy nhanh việc áp dụng quy trình làm việc AI trong doanh nghiệp. Phù hợp với NVIDIA AI Blueprints, công cụ này hướng đến việc đơn giản hóa quá trình chuyển đổi các ứng dụng AI sang sản xuất. Công cụ này, có sẵn trên NGC hoặc kho lưu trữ NVIDIA/k8s-nim-operator GitHub , cũng cung cấp các tài nguyên hỗ trợ doanh nghiệp và hỗ trợ kỹ thuật.
Chia sẻ bài viết này:

%20(1).webp)
%20(1).webp)