Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo
%20(1).webp)
NVIDIA đơn giản hóa việc triển khai tác nhân cục bộ trên DGX
Generatived
0:00 3/6/26
NVIDIA vừa công bố các bản cập nhật mới cho DGX Spark được thiết kế để đơn giản hóa việc triển khai và vận hành các tác nhân AI tự động trong môi trường cục bộ. Công ty cho biết các nhà phát triển giờ đây có thể chuyển từ thiết lập thiết bị sang chạy tác nhân AI chỉ trong vài phút thông qua quy trình cài đặt được tối ưu hóa.
Theo NVIDIA, bản thiết kế NemoClaw kết hợp các mô hình mở, môi trường chạy tác nhân và môi trường thực thi an toàn OpenShell thành một quy trình triển khai thống nhất. Cách tiếp cận này nhằm giúp các nhà phát triển giữ dữ liệu nhạy cảm trên thiết bị trong khi vẫn duy trì quyền kiểm soát đối với quyền hạn và hoạt động của tác nhân.
Công ty cũng giới thiệu các cải tiến hiệu suất cho các mô hình Qwen3.6-35B, báo cáo thông lượng suy luận cao hơn tới 2,6 lần thông qua việc triển khai vLLM được tối ưu hóa. Những cải tiến này nhằm mục đích tăng tốc khối lượng công việc AI dựa trên tác nhân trên phần cứng cục bộ.
Ngoài ra, NVIDIA đã mở rộng hỗ trợ cho việc triển khai đa nút thông qua trợ lý cụm NVIDIA Sync. Công cụ này tự động hóa các tác vụ mạng và cấu hình, cho phép các nhà phát triển kết nối tối đa bốn hệ thống DGX Spark cho các mô hình lớn hơn, suy luận phân tán và khối lượng công việc đa tác nhân.
Chia sẻ bài viết này:
Tin tức mới nhất
CRED mở rộng nền tảng phát triển AI với các tác nhân (Agents)
0:00 2/6/26
CRED, có trụ sở chính tại Bengaluru, Ấn Độ, đã thông báo về việc triển khai CRED codelens, một lớp trí tuệ nhân tạo được thiết kế để thống nhất kiến thức phần mềm
THIM xây dựng nền tảng quản lý nhập cư Thái Lan trên AWS.
0:00 2/6/26
Công ty Digital Identity, có trụ sở tại Bangkok, thông báo rằng Hệ thống Quản lý Nhập cư Thái Lan (THIM) đã được phát triển trên nền tảng Amazon Web Service
NVIDIA giới thiệu Dynamo Snapshot để tăng tốc quá trình suy luận.
0:00 2/6/26
NVIDIA đã giới thiệu Dynamo Snapshot, một khung sao lưu và khôi phục được thiết kế để giảm độ trễ khởi động cho các khối lượng công việc suy luận AI chạy trên Kubernetes.
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
CRED mở rộng nền tảng phát triển AI với các tác nhân (Agents)
0:00 2/6/26
CRED, có trụ sở chính tại Bengaluru, Ấn Độ, đã thông báo về việc triển khai CRED codelens, một lớp trí tuệ nhân tạo được thiết kế để thống nhất kiến thức phần mềm
THIM xây dựng nền tảng quản lý nhập cư Thái Lan trên AWS.
0:00 2/6/26
Công ty Digital Identity, có trụ sở tại Bangkok, thông báo rằng Hệ thống Quản lý Nhập cư Thái Lan (THIM) đã được phát triển trên nền tảng Amazon Web Service
NVIDIA giới thiệu Dynamo Snapshot để tăng tốc quá trình suy luận.
0:00 2/6/26
NVIDIA đã giới thiệu Dynamo Snapshot, một khung sao lưu và khôi phục được thiết kế để giảm độ trễ khởi động cho các khối lượng công việc suy luận AI chạy trên Kubernetes.

%20(1).webp)
%20(1).webp)
%20(1).webp)
%20(1).webp)

