Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Google Cloud và NVIDIA công bố các khả năng AI mới
Generatived
0:00 5/11/25
Google Cloud (California, Hoa Kỳ) đã công bố các tính năng mới hỗ trợ phát triển và triển khai các mô hình AI. Công ty cũng tăng cường hợp tác với NVIDIA (California, Hoa Kỳ) để củng cố nền tảng, bao phủ toàn bộ vòng đời AI. Phiên bản A4X Max mới được trang bị bộ xử lý NVIDIA GB300 NVL72 và được thiết kế đặc biệt cho suy luận AI đa phương thức.
Google Kubernetes Engine (GKE) hiện hỗ trợ Trình điều khiển Mạng Kubernetes Phân bổ Tài nguyên Động (DRANET) để cải thiện băng thông cho các khối lượng công việc AI/ML phân tán. GKE Inference Gateway tích hợp với NVIDIA NeMo Guardrails, và Vertex AI Model Garden sẽ cung cấp các mô hình NVIDIA Nemotron.
A4X Max được trang bị GPU Blackwell Ultra và CPU Grace của NVIDIA, hoạt động như một nền tảng điện toán tích hợp với giao tiếp băng thông cao và bộ nhớ dùng chung. Kết hợp với bộ điều hợp Titanium ML và nền tảng mạng Jupiter của Google , A4X Max được thiết kế để mở rộng lên đến hàng chục nghìn GPU. A4X Max sử dụng Cluster Director của Google Cloud để cung cấp một môi trường kết hợp các dịch vụ điện toán, mạng và lưu trữ được tối ưu hóa.
Google đang xem trước A4X Max và tiếp tục hỗ trợ máy ảo G4 với GPU NVIDIA RTX PRO 6000 Blackwell Server Edition và thư viện NVIDIA Omniverse, cung cấp nền tảng đầu cuối cho khối lượng công việc AI và hợp tác với NVIDIA để tạo ra hệ sinh thái mạnh mẽ cho AI thế hệ tiếp theo.
Chia sẻ bài viết này:

