Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo
%20(1).webp)
NVIDIA giành chiến thắng áp đảo trong sáu bài kiểm tra hiệu năng MLPerf Training.
Generatived
0:00 22/6/26
NVIDIA thông báo đã đạt được vị trí dẫn đầu trên tất cả các bài kiểm tra hiệu năng trong MLPerf Training v6.0, bộ kiểm tra hiệu năng huấn luyện AI tiêu chuẩn ngành mới nhất do MLCommons phát triển.
Công ty này là đơn vị duy nhất nộp kết quả cho cả bảy khối lượng công việc, bao gồm cả các mô hình DeepSeek-V3 671B và GPT-OSS-20B (mô hình hỗn hợp các chuyên gia) mới được giới thiệu. NVIDIA báo cáo thời gian huấn luyện nhanh nhất cũng như hiệu năng cao nhất trên mỗi bộ tăng tốc trong mọi hạng mục kiểm tra hiệu năng.
Sử dụng hệ thống NVIDIA GB300 NVL72 và GB200 NVL72, NVIDIA và các đối tác điện toán đám mây của họ đã mở rộng cụm huấn luyện lên tới 8.192 GPU Blackwell. Kết quả được báo cáo bao gồm 2,02 phút cho DeepSeek-V3 671B và 7,07 phút cho Llama 3.1 405B ở quy mô lớn.
Theo NVIDIA, kết quả này đạt được nhờ sự kết hợp giữa các cải tiến phần cứng và phần mềm, bao gồm đồ thị CUDA lặp đầy đủ, tối ưu hóa nhân CuTe DSL, kỹ thuật độ chính xác MXFP8 và các công nghệ mạng tiên tiến như Spectrum-X Ethernet và Quantum InfiniBand. Công ty cho biết những tối ưu hóa này đã cải thiện đáng kể hiệu quả huấn luyện cho các mô hình AI tạo sinh quy mô lớn.
Chia sẻ bài viết này:

