top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Bản xem trước Google GKE DRANET đã được phát hành

Generatived

0:00 5/11/25

Google(California, Hoa Kỳ) đang nỗ lực cải thiện hiệu suất của các mô hình chạy trên Kubernetes và Google Kubernetes Engine (GKE) nhằm đáp ứng nhu cầu ngày càng tăng về cơ sở hạ tầng do sự phát triển của các mô hình AI/ML. Cụ thể, công ty đang hợp tác với cộng đồng nguồn mở để cho phép Kubernetes nhận dạng các tính năng phần cứng chuyên biệt. Google đã tập trung phát triển một khuôn khổ phân bổ tài nguyên động (DRA) cho Kubernetes và đề xuất giải pháp Phân bổ Tài nguyên Động cho Mạng (DRANET).

Hôm nay, Google đã công bố bản xem trước của Managed DRANET dành cho Google Kubernetes Engine (GKE). Google Cloud sẽ triển khai Managed DRANET trên các phiên bản A4X Max trong môi trường sản xuất. Giải pháp này phân bổ thông minh các giao diện mạng hiệu suất cao trên Kubernetes để giải quyết vấn đề hiệu suất mạng và độ phức tạp trong vận hành của khối lượng công việc AI.

DRANET trên GKE được tối ưu hóa đặc biệt cho các khối lượng công việc AI sử dụng nhiều GPU. Tuy nhiên, giao diện mạng Kubernetes truyền thống khiến việc tận dụng tối đa các tính năng này trở nên khó khăn. Với DRANET được Quản lý của Google, mặt phẳng điều khiển GKE cho phép căn chỉnh NUMA giữa GPU và giao diện mạng, cải thiện thông lượng.

Phiên bản Google Cloud A4X Max dựa trên hệ thống NVIDIA GB300 NVL72 dạng rack-scale và kết hợp với Managed DRANET cho GKE, tối đa hóa hiệu suất phần cứng, đảm bảo mỗi GPU đều có đường dẫn mạng chuyên dụng, nhất quán và độ trễ thấp cần thiết. Thông tin chi tiết hơn về các phiên bản này, được xây dựng cho AI quy mô cực lớn, có thể được tìm thấy trong blog ra mắt.

Chia sẻ bài viết này:

Tin tức mới nhất
Bản xem trước Google GKE DRANET đã được phát hành

Bản xem trước Google GKE DRANET đã được phát hành

0:00 5/11/25

Google(California, Hoa Kỳ) đang nỗ lực cải thiện hiệu suất của các mô hình chạy trên Kubernetes và Google Kubernetes Engine (GKE) để đáp ứng nhu cầu ngày càng tăng về cơ sở hạ tầng do sự phát triển của các mô hình AI/ML.

Google Tech công bố Managed Lustre để tăng cường suy luận AI

Google Tech công bố Managed Lustre để tăng cường suy luận AI

0:00 5/11/25

Nhu cầu về cơ sở hạ tầng suy luận AI dự kiến sẽ tăng nhanh hơn so với đầu tư vào đào tạo các mô hình AI, nhờ vào trải nghiệm người dùng được cải thiện và sự xuất hiện của AI tiên tiến hơn.

NVIDIA Clara Reason nâng cao khả năng chẩn đoán hình ảnh y tế

NVIDIA Clara Reason nâng cao khả năng chẩn đoán hình ảnh y tế

0:00 5/11/25

NVIDIA vừa công bố Clara Reason, một mô hình AI mới được thiết kế để cải thiện khả năng diễn giải chẩn đoán hình ảnh y tế.

AWS công bố quan hệ đối tác nhiều năm với OpenAI

AWS công bố quan hệ đối tác nhiều năm với OpenAI

0:00 5/11/25

Amazon Web Services (AWS) đã ký kết quan hệ đối tác chiến lược nhiều năm với công ty đổi mới AI OpenAI.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Bản xem trước Google GKE DRANET đã được phát hành

Bản xem trước Google GKE DRANET đã được phát hành

0:00 5/11/25

Google(California, Hoa Kỳ) đang nỗ lực cải thiện hiệu suất của các mô hình chạy trên Kubernetes và Google Kubernetes Engine (GKE) để đáp ứng nhu cầu ngày càng tăng về cơ sở hạ tầng do sự phát triển của các mô hình AI/ML.

Google Tech công bố Managed Lustre để tăng cường suy luận AI

Google Tech công bố Managed Lustre để tăng cường suy luận AI

0:00 5/11/25

Nhu cầu về cơ sở hạ tầng suy luận AI dự kiến sẽ tăng nhanh hơn so với đầu tư vào đào tạo các mô hình AI, nhờ vào trải nghiệm người dùng được cải thiện và sự xuất hiện của AI tiên tiến hơn.

NVIDIA Clara Reason nâng cao khả năng chẩn đoán hình ảnh y tế

NVIDIA Clara Reason nâng cao khả năng chẩn đoán hình ảnh y tế

0:00 5/11/25

NVIDIA vừa công bố Clara Reason, một mô hình AI mới được thiết kế để cải thiện khả năng diễn giải chẩn đoán hình ảnh y tế.

AWS công bố quan hệ đối tác nhiều năm với OpenAI

AWS công bố quan hệ đối tác nhiều năm với OpenAI

0:00 5/11/25

Amazon Web Services (AWS) đã ký kết quan hệ đối tác chiến lược nhiều năm với công ty đổi mới AI OpenAI.

bottom of page