Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA Grove nâng cao khả năng quản lý khối lượng công việc AI trên Kubernetes

Generatived

0:00 12/11/25

Suy luận AI đã trải qua một quá trình chuyển đổi lớn, phát triển thành các hệ thống phức tạp đòi hỏi sự phối hợp tiên tiến. Việc triển khai một mô hình AI đòi hỏi nhiều thành phần, chẳng hạn như bộ điền trước, bộ giải mã và bộ mã hóa thị giác, phối hợp hoạt động để thực hiện các tác vụ. Sự phức tạp này đã chuyển trọng tâm từ nhiệm vụ đơn giản là chạy nhiều bản sao sang việc phối hợp các thành phần này thành một khối thống nhất. Mỗi thành phần có cấu hình và yêu cầu tài nguyên riêng, và chúng phải được khởi chạy và sắp xếp theo thứ tự cụ thể trong một cấu trúc mạng để hoạt động hiệu quả.

Để giải quyết những thách thức phức tạp trong việc quản lý các hệ thống tiên tiến này, NVIDIA đã giới thiệu NVIDIA Grove cho NVIDIA Dynamo, một API Kubernetes giúp dễ dàng vận hành các khối lượng công việc suy luận học máy (ML) hiện đại trên các cụm Kubernetes. Là mã nguồn mở và có thể truy cập trên GitHub, Grove cho phép các nhà phát triển mở rộng quy mô triển khai suy luận từ một bản sao duy nhất lên quy mô trung tâm dữ liệu, hỗ trợ hàng nghìn GPU. Grove cung cấp một cách để mô tả toàn bộ hệ thống suy luận như một tài nguyên tùy chỉnh duy nhất, cho phép lập lịch nhóm phân cấp, sắp xếp theo cấu trúc liên kết và tự động mở rộng đa cấp.

Tính linh hoạt của Grove được thể hiện qua khả năng đáp ứng nhiều kiến trúc suy luận thực tế, từ cấu hình một nút đơn đến các quy trình tác nhân phức tạp. Các nhà phát triển có thể định nghĩa các ngăn xếp AI phức tạp một cách rõ ràng, mang tính khai báo và không phụ thuộc vào khuôn khổ. Hệ thống đáp ứng các nhu cầu như tự động điều chỉnh quy mô đa cấp, quản lý vòng đời, lập lịch nhóm phân cấp và lập lịch theo cấu trúc liên kết, đồng thời đảm bảo việc phối hợp và khởi tạo thành phần.

API Grove quản lý khối lượng công việc AI đa thành phần bằng cách sử dụng các tài nguyên tùy chỉnh phân cấp, cung cấp logic cụ thể theo vai trò và khả năng mở rộng đa cấp. Phương pháp này đảm bảo triển khai tối ưu trên các môi trường cụm không đồng nhất. Một cụm Kubernetes hỗ trợ Grove kết hợp toán tử Grove với một bộ lập lịch hiểu được tài nguyên PodGang để chuyển đổi định nghĩa khối lượng công việc thành các ràng buộc lập lịch cụ thể. Điều này cho phép triển khai phối hợp các hệ thống AI, đảm bảo các thành phần được khởi chạy theo đúng thứ tự, được định vị để đạt hiệu suất tối ưu và được khôi phục thành một nhóm thống nhất.

Dành cho những ai quan tâm đến việc áp dụng kiến trúc dịch vụ phân tán, NVIDIA cung cấp hướng dẫn từng bước sử dụng Dynamo và Grove. NVIDIA mời cộng đồng khám phá các tính năng của Grove, đóng góp vào quá trình phát triển và tham gia dự án trên GitHub hoặc Discord. NVIDIA cũng xin cảm ơn tất cả những người đóng góp, đặc biệt là SAP, vì sự hỗ trợ và đóng góp to lớn của họ cho dự án Grove.

Nguồn: Blog nhà phát triển NVIDIA

Chia sẻ bài viết này:

Tin tức mới nhất

Cải thiện độ chính xác khi đọc hóa đơn AI của Invox

0:00 12/11/25

invox (Shinjuku-ku, Tokyo) đã bổ sung chức năng "Đọc AI Agent" sử dụng AI để học hướng dẫn sử dụng và đọc hóa đơn với độ chính xác cao.

đọc thêm

Chiến lược GPT tùy chỉnh của PE-BANK cho Kỷ nguyên GPT-5

0:00 12/11/25

PE-BANK (Minato-ku, Tokyo) sẽ tổ chức hội thảo có tựa đề "Chiến lược GPT tùy chỉnh trong kỷ nguyên GPT-5" vào ngày 12 tháng 11 năm 2025.

đọc thêm

NX OneBishi lưu trữ nguyên mẫu AI của Bakumatsu

0:00 12/11/25

NX Onebishi Archives (Minato-ku, Tokyo), hợp tác với Phó giáo sư Sanae Ikeda của Đại học tỉnh Kyoto, đã phát triển nguyên mẫu AI đàm thoại cho Shinagawa Yajiro,

đọc thêm

Hội thảo trực tuyến về chất lượng dữ liệu AI của Visual Bank

0:00 12/11/25

Visual Bank (Minato-ku, Tokyo) đã tận dụng kinh nghiệm được Bộ Kinh tế, Thương mại và Công nghiệp lựa chọn và dự án "GENIAC" của NEDO để phát triển "Bộ dữ liệu Qlean", một giải pháp dữ liệu cho việc học AI.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Cải thiện độ chính xác khi đọc hóa đơn AI của Invox

0:00 12/11/25

invox (Shinjuku-ku, Tokyo) đã bổ sung chức năng "Đọc AI Agent" sử dụng AI để học hướng dẫn sử dụng và đọc hóa đơn với độ chính xác cao.

đọc thêm

Chiến lược GPT tùy chỉnh của PE-BANK cho Kỷ nguyên GPT-5

0:00 12/11/25

PE-BANK (Minato-ku, Tokyo) sẽ tổ chức hội thảo có tựa đề "Chiến lược GPT tùy chỉnh trong kỷ nguyên GPT-5" vào ngày 12 tháng 11 năm 2025.

đọc thêm

NX OneBishi lưu trữ nguyên mẫu AI của Bakumatsu

0:00 12/11/25

NX Onebishi Archives (Minato-ku, Tokyo), hợp tác với Phó giáo sư Sanae Ikeda của Đại học tỉnh Kyoto, đã phát triển nguyên mẫu AI đàm thoại cho Shinagawa Yajiro,

đọc thêm

Hội thảo trực tuyến về chất lượng dữ liệu AI của Visual Bank

0:00 12/11/25

Visual Bank (Minato-ku, Tokyo) đã tận dụng kinh nghiệm được Bộ Kinh tế, Thương mại và Công nghiệp lựa chọn và dự án "GENIAC" của NEDO để phát triển "Bộ dữ liệu Qlean", một giải pháp dữ liệu cho việc học AI.

đọc thêm