Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo
%20(1).webp)
NVIDIA đơn giản hóa việc triển khai tác nhân cục bộ trên DGX
Generatived
0:00 3/6/26
NVIDIA vừa công bố các bản cập nhật mới cho DGX Spark được thiết kế để đơn giản hóa việc triển khai và vận hành các tác nhân AI tự động trong môi trường cục bộ. Công ty cho biết các nhà phát triển giờ đây có thể chuyển từ thiết lập thiết bị sang chạy tác nhân AI chỉ trong vài phút thông qua quy trình cài đặt được tối ưu hóa.
Theo NVIDIA, bản thiết kế NemoClaw kết hợp các mô hình mở, môi trường chạy tác nhân và môi trường thực thi an toàn OpenShell thành một quy trình triển khai thống nhất. Cách tiếp cận này nhằm giúp các nhà phát triển giữ dữ liệu nhạy cảm trên thiết bị trong khi vẫn duy trì quyền kiểm soát đối với quyền hạn và hoạt động của tác nhân.
Công ty cũng giới thiệu các cải tiến hiệu suất cho các mô hình Qwen3.6-35B, báo cáo thông lượng suy luận cao hơn tới 2,6 lần thông qua việc triển khai vLLM được tối ưu hóa. Những cải tiến này nhằm mục đích tăng tốc khối lượng công việc AI dựa trên tác nhân trên phần cứng cục bộ.
Ngoài ra, NVIDIA đã mở rộng hỗ trợ cho việc triển khai đa nút thông qua trợ lý cụm NVIDIA Sync. Công cụ này tự động hóa các tác vụ mạng và cấu hình, cho phép các nhà phát triển kết nối tối đa bốn hệ thống DGX Spark cho các mô hình lớn hơn, suy luận phân tán và khối lượng công việc đa tác nhân.
Chia sẻ bài viết này:

