top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA NIM Operator 3.0.0 nâng cao khả năng quản lý AI của Kubernetes

Generatived

0:00 12/9/25

NVIDIA vừa công bố NIM Operator 3.0.0, một công cụ nâng cao khả năng quản lý các luồng suy luận AI trong môi trường Kubernetes. Phiên bản mới nhất này nhằm mục đích hợp lý hóa việc triển khai các dịch vụ vi mô NVIDIA NIM và NeMo, tập trung vào việc sử dụng tài nguyên hiệu quả và khả năng tương thích với cơ sở hạ tầng Kubernetes hiện có. NIM Operator đặc biệt hữu ích cho các quản trị viên cụm chịu trách nhiệm vận hành các thành phần phần mềm phức tạp cần thiết để chạy các mô hình AI tiên tiến.

Công ty đã hợp tác với Red Hat để tích hợp triển khai NIM vào KServe, giúp đơn giản hóa việc triển khai các vi dịch vụ NIM có khả năng mở rộng. Đội ngũ kỹ thuật của Red Hat đã đóng góp vào dự án nguồn mở này, cho phép các Nhà vận hành NIM tận dụng khả năng quản lý vòng đời và lưu trữ mô hình của KServe. Sự hợp tác này được kỳ vọng sẽ cải thiện trải nghiệm người dùng bằng cách cung cấp AI đáng tin cậy trên các điểm cuối suy luận của KServe thông qua NeMo Guardrails.

Khách hàng và đối tác của NVIDIA đã tận dụng NIM Operator để quản lý hiệu quả các ứng dụng và tác nhân AI đa dạng. Công cụ này hỗ trợ nhiều mô hình AI, bao gồm cả những mô hình được sử dụng trong chatbot, RAG dựa trên tác nhân, phát hiện thuốc ảo, v.v. Với việc phát hành NIM Operator 3.0.0, người dùng giờ đây có thể triển khai hiệu quả hơn các NIM đa LLM và đa nút, đồng thời tận dụng các tính năng như phân bổ tài nguyên động (DRA) để cải thiện khả năng quản lý GPU.

NIM Operator 3.0.0 là một phần trong nỗ lực rộng lớn hơn của NVIDIA nhằm đẩy nhanh việc áp dụng quy trình làm việc AI trong doanh nghiệp. Phù hợp với NVIDIA AI Blueprints, công cụ này hướng đến việc đơn giản hóa quá trình chuyển đổi các ứng dụng AI sang sản xuất. Công cụ này, có sẵn trên NGC hoặc kho lưu trữ NVIDIA/k8s-nim-operator GitHub , cũng cung cấp các tài nguyên hỗ trợ doanh nghiệp và hỗ trợ kỹ thuật.

Chia sẻ bài viết này:

Tin tức mới nhất
Microsoft chia sẻ các phương pháp đánh giá rủi ro doanh nghiệp.

Microsoft chia sẻ các phương pháp đánh giá rủi ro doanh nghiệp.

0:00 1/5/26

Microsoft cho biết Phó Giám đốc An ninh Thông tin (CISO) Rico Mariani đã vạch ra các phương pháp chính để đánh giá rủi ro doanh nghiệp khi hoạt động đe dọa mạng gia tăng cùng

NVIDIA mở rộng hướng dẫn về kiến ​�​trúc nhà máy AI dành cho doanh nghiệp.

NVIDIA mở rộng hướng dẫn về kiến ​​trúc nhà máy AI dành cho doanh nghiệp.

0:00 1/5/26

NVIDIA đã trình bày chi tiết Kiến trúc Tham chiếu Doanh nghiệp và cấu hình nhà máy AI được thiết kế để hỗ trợ triển khai hệ thống AI tác nhân và AI tạo sinh trong môi trường tại chỗ.

OpenAI m�ở rộng cơ sở hạ tầng AI Stargate trên toàn quốc.

OpenAI mở rộng cơ sở hạ tầng AI Stargate trên toàn quốc.

0:00 1/5/26

OpenAI cho biết họ đã đẩy nhanh tiến độ phát triển sáng kiến ​​cơ sở hạ tầng AI "Stargate", vượt qua các mục tiêu triển khai điện toán dài hạn sớm hơn dự kiến ​​do nhu cầu về hệ thống AI

Sourcenext mở rộng các tính năng tự động hóa đám mây AutoMemo.

Sourcenext mở rộng các tính năng tự động hóa đám mây AutoMemo.

0:00 1/5/26

Sourcenext vừa công bố bản cập nhật lớn cho dịch vụ phiên âm AI “AutoMemo”, bổ sung các tính năng tích hợp đám mây tự động

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Microsoft chia sẻ các phương pháp đánh giá rủi ro doanh nghiệp.

Microsoft chia sẻ các phương pháp đánh giá rủi ro doanh nghiệp.

0:00 1/5/26

Microsoft cho biết Phó Giám đốc An ninh Thông tin (CISO) Rico Mariani đã vạch ra các phương pháp chính để đánh giá rủi ro doanh nghiệp khi hoạt động đe dọa mạng gia tăng cùng

NVIDIA mở rộng hướng dẫn về kiến ​​trúc nhà máy AI dành cho doanh nghiệp.

NVIDIA mở rộng hướng dẫn về kiến ​​trúc nhà máy AI dành cho doanh nghiệp.

0:00 1/5/26

NVIDIA đã trình bày chi tiết Kiến trúc Tham chiếu Doanh nghiệp và cấu hình nhà máy AI được thiết kế để hỗ trợ triển khai hệ thống AI tác nhân và AI tạo sinh trong môi trường tại chỗ.

OpenAI mở rộng cơ sở hạ tầng AI Stargate trên toàn quốc.

OpenAI mở rộng cơ sở hạ tầng AI Stargate trên toàn quốc.

0:00 1/5/26

OpenAI cho biết họ đã đẩy nhanh tiến độ phát triển sáng kiến ​​cơ sở hạ tầng AI "Stargate", vượt qua các mục tiêu triển khai điện toán dài hạn sớm hơn dự kiến ​​do nhu cầu về hệ thống AI

Sourcenext mở rộng các tính năng tự động hóa đám mây AutoMemo.

Sourcenext mở rộng các tính năng tự động hóa đám mây AutoMemo.

0:00 1/5/26

Sourcenext vừa công bố bản cập nhật lớn cho dịch vụ phiên âm AI “AutoMemo”, bổ sung các tính năng tích hợp đám mây tự động

bottom of page