Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA NIM Operator 3.0.0 nâng cao khả năng quản lý AI của Kubernetes

Generatived

0:00 12/9/25

NVIDIA vừa công bố NIM Operator 3.0.0, một công cụ nâng cao khả năng quản lý các luồng suy luận AI trong môi trường Kubernetes. Phiên bản mới nhất này nhằm mục đích hợp lý hóa việc triển khai các dịch vụ vi mô NVIDIA NIM và NeMo, tập trung vào việc sử dụng tài nguyên hiệu quả và khả năng tương thích với cơ sở hạ tầng Kubernetes hiện có. NIM Operator đặc biệt hữu ích cho các quản trị viên cụm chịu trách nhiệm vận hành các thành phần phần mềm phức tạp cần thiết để chạy các mô hình AI tiên tiến.

Công ty đã hợp tác với Red Hat để tích hợp triển khai NIM vào KServe, giúp đơn giản hóa việc triển khai các vi dịch vụ NIM có khả năng mở rộng. Đội ngũ kỹ thuật của Red Hat đã đóng góp vào dự án nguồn mở này, cho phép các Nhà vận hành NIM tận dụng khả năng quản lý vòng đời và lưu trữ mô hình của KServe. Sự hợp tác này được kỳ vọng sẽ cải thiện trải nghiệm người dùng bằng cách cung cấp AI đáng tin cậy trên các điểm cuối suy luận của KServe thông qua NeMo Guardrails.

Khách hàng và đối tác của NVIDIA đã tận dụng NIM Operator để quản lý hiệu quả các ứng dụng và tác nhân AI đa dạng. Công cụ này hỗ trợ nhiều mô hình AI, bao gồm cả những mô hình được sử dụng trong chatbot, RAG dựa trên tác nhân, phát hiện thuốc ảo, v.v. Với việc phát hành NIM Operator 3.0.0, người dùng giờ đây có thể triển khai hiệu quả hơn các NIM đa LLM và đa nút, đồng thời tận dụng các tính năng như phân bổ tài nguyên động (DRA) để cải thiện khả năng quản lý GPU.

NIM Operator 3.0.0 là một phần trong nỗ lực rộng lớn hơn của NVIDIA nhằm đẩy nhanh việc áp dụng quy trình làm việc AI trong doanh nghiệp. Phù hợp với NVIDIA AI Blueprints, công cụ này hướng đến việc đơn giản hóa quá trình chuyển đổi các ứng dụng AI sang sản xuất. Công cụ này, có sẵn trên NGC hoặc kho lưu trữ NVIDIA/k8s-nim-operator GitHub , cũng cung cấp các tài nguyên hỗ trợ doanh nghiệp và hỗ trợ kỹ thuật.

Nguồn: Blog nhà phát triển NVIDIA

Chia sẻ bài viết này:

Tin tức mới nhất

Microsoft chia sẻ các phương pháp đánh giá rủi ro doanh nghiệp.

0:00 1/5/26

Microsoft cho biết Phó Giám đốc An ninh Thông tin (CISO) Rico Mariani đã vạch ra các phương pháp chính để đánh giá rủi ro doanh nghiệp khi hoạt động đe dọa mạng gia tăng cùng

đọc thêm

NVIDIA mở rộng hướng dẫn về kiến trúc nhà máy AI dành cho doanh nghiệp.

0:00 1/5/26

NVIDIA đã trình bày chi tiết Kiến trúc Tham chiếu Doanh nghiệp và cấu hình nhà máy AI được thiết kế để hỗ trợ triển khai hệ thống AI tác nhân và AI tạo sinh trong môi trường tại chỗ.

đọc thêm

OpenAI mở rộng cơ sở hạ tầng AI Stargate trên toàn quốc.

0:00 1/5/26

OpenAI cho biết họ đã đẩy nhanh tiến độ phát triển sáng kiến cơ sở hạ tầng AI "Stargate", vượt qua các mục tiêu triển khai điện toán dài hạn sớm hơn dự kiến do nhu cầu về hệ thống AI

đọc thêm

Sourcenext mở rộng các tính năng tự động hóa đám mây AutoMemo.

0:00 1/5/26

Sourcenext vừa công bố bản cập nhật lớn cho dịch vụ phiên âm AI “AutoMemo”, bổ sung các tính năng tích hợp đám mây tự động

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Microsoft chia sẻ các phương pháp đánh giá rủi ro doanh nghiệp.

0:00 1/5/26

Microsoft cho biết Phó Giám đốc An ninh Thông tin (CISO) Rico Mariani đã vạch ra các phương pháp chính để đánh giá rủi ro doanh nghiệp khi hoạt động đe dọa mạng gia tăng cùng

đọc thêm

NVIDIA mở rộng hướng dẫn về kiến trúc nhà máy AI dành cho doanh nghiệp.

0:00 1/5/26

NVIDIA đã trình bày chi tiết Kiến trúc Tham chiếu Doanh nghiệp và cấu hình nhà máy AI được thiết kế để hỗ trợ triển khai hệ thống AI tác nhân và AI tạo sinh trong môi trường tại chỗ.

đọc thêm

OpenAI mở rộng cơ sở hạ tầng AI Stargate trên toàn quốc.

0:00 1/5/26

OpenAI cho biết họ đã đẩy nhanh tiến độ phát triển sáng kiến cơ sở hạ tầng AI "Stargate", vượt qua các mục tiêu triển khai điện toán dài hạn sớm hơn dự kiến do nhu cầu về hệ thống AI

đọc thêm

Sourcenext mở rộng các tính năng tự động hóa đám mây AutoMemo.

0:00 1/5/26

Sourcenext vừa công bố bản cập nhật lớn cho dịch vụ phiên âm AI “AutoMemo”, bổ sung các tính năng tích hợp đám mây tự động

đọc thêm