top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA NIM Operator 3.0.0 nâng cao khả năng quản lý AI của Kubernetes

Generatived

0:00 12/9/25

NVIDIA vừa công bố NIM Operator 3.0.0, một công cụ nâng cao khả năng quản lý các luồng suy luận AI trong môi trường Kubernetes. Phiên bản mới nhất này nhằm mục đích hợp lý hóa việc triển khai các dịch vụ vi mô NVIDIA NIM và NeMo, tập trung vào việc sử dụng tài nguyên hiệu quả và khả năng tương thích với cơ sở hạ tầng Kubernetes hiện có. NIM Operator đặc biệt hữu ích cho các quản trị viên cụm chịu trách nhiệm vận hành các thành phần phần mềm phức tạp cần thiết để chạy các mô hình AI tiên tiến.

Công ty đã hợp tác với Red Hat để tích hợp triển khai NIM vào KServe, giúp đơn giản hóa việc triển khai các vi dịch vụ NIM có khả năng mở rộng. Đội ngũ kỹ thuật của Red Hat đã đóng góp vào dự án nguồn mở này, cho phép các Nhà vận hành NIM tận dụng khả năng quản lý vòng đời và lưu trữ mô hình của KServe. Sự hợp tác này được kỳ vọng sẽ cải thiện trải nghiệm người dùng bằng cách cung cấp AI đáng tin cậy trên các điểm cuối suy luận của KServe thông qua NeMo Guardrails.

Khách hàng và đối tác của NVIDIA đã tận dụng NIM Operator để quản lý hiệu quả các ứng dụng và tác nhân AI đa dạng. Công cụ này hỗ trợ nhiều mô hình AI, bao gồm cả những mô hình được sử dụng trong chatbot, RAG dựa trên tác nhân, phát hiện thuốc ảo, v.v. Với việc phát hành NIM Operator 3.0.0, người dùng giờ đây có thể triển khai hiệu quả hơn các NIM đa LLM và đa nút, đồng thời tận dụng các tính năng như phân bổ tài nguyên động (DRA) để cải thiện khả năng quản lý GPU.

NIM Operator 3.0.0 là một phần trong nỗ lực rộng lớn hơn của NVIDIA nhằm đẩy nhanh việc áp dụng quy trình làm việc AI trong doanh nghiệp. Phù hợp với NVIDIA AI Blueprints, công cụ này hướng đến việc đơn giản hóa quá trình chuyển đổi các ứng dụng AI sang sản xuất. Công cụ này, có sẵn trên NGC hoặc kho lưu trữ NVIDIA/k8s-nim-operator GitHub , cũng cung cấp các tài nguyên hỗ trợ doanh nghiệp và hỗ trợ kỹ thuật.

Chia sẻ bài viết này:

Tin tức mới nhất
Công cụ khắc phục sự cố Spark mới trên Google Cloud

Công cụ khắc phục sự cố Spark mới trên Google Cloud

0:00 12/9/25

Google Cloud (California, Hoa Kỳ) đã phát hành bản xem trước công khai của Gemini Cloud Assist Investigations, một công cụ mới hỗ trợ khắc phục sự cố Apache Spark.

Hỗ trợ dịch vụ hành chính AI của Microsoft Osaka

Hỗ trợ dịch vụ hành chính AI của Microsoft Osaka

0:00 12/9/25

Microsoft (Osaka) đã công bố một dự án mới hợp tác với Tỉnh Osaka (Osaka) nhằm mục đích cải thiện các dịch vụ của chính phủ bằng cách sử dụng các tác nhân AI.

NVIDIA RTX PRO 6000 tăng tốc quá trình suy luận cấu trúc protein

NVIDIA RTX PRO 6000 tăng tốc quá trình suy luận cấu trúc protein

0:00 12/9/25

NVIDIA vừa công bố GPU RTX PRO 6000 Blackwell Server Edition giúp cải thiện đáng kể tốc độ suy luận cấu trúc protein.

Google Cloud công bố các phương pháp triển khai AI hiệu quả

Google Cloud công bố các phương pháp triển khai AI hiệu quả

0:00 12/9/25

Google Cloud đã công bố giải pháp mới nhằm giải quyết những thách thức của kiến ​​trúc dịch vụ dựa trên GPU truyền thống và triển khai các mô hình AI hiệu quả hơn.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Công cụ khắc phục sự cố Spark mới trên Google Cloud

Công cụ khắc phục sự cố Spark mới trên Google Cloud

0:00 12/9/25

Google Cloud (California, Hoa Kỳ) đã phát hành bản xem trước công khai của Gemini Cloud Assist Investigations, một công cụ mới hỗ trợ khắc phục sự cố Apache Spark.

Hỗ trợ dịch vụ hành chính AI của Microsoft Osaka

Hỗ trợ dịch vụ hành chính AI của Microsoft Osaka

0:00 12/9/25

Microsoft (Osaka) đã công bố một dự án mới hợp tác với Tỉnh Osaka (Osaka) nhằm mục đích cải thiện các dịch vụ của chính phủ bằng cách sử dụng các tác nhân AI.

NVIDIA RTX PRO 6000 tăng tốc quá trình suy luận cấu trúc protein

NVIDIA RTX PRO 6000 tăng tốc quá trình suy luận cấu trúc protein

0:00 12/9/25

NVIDIA vừa công bố GPU RTX PRO 6000 Blackwell Server Edition giúp cải thiện đáng kể tốc độ suy luận cấu trúc protein.

Google Cloud công bố các phương pháp triển khai AI hiệu quả

Google Cloud công bố các phương pháp triển khai AI hiệu quả

0:00 12/9/25

Google Cloud đã công bố giải pháp mới nhằm giải quyết những thách thức của kiến ​​trúc dịch vụ dựa trên GPU truyền thống và triển khai các mô hình AI hiệu quả hơn.

bottom of page