Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA ra mắt mô hình lượng tử hóa Nemotron Ultra NVFP4.
Generatived
0:00 29/6/26
NVIDIA đã công bố bản cập nhật NVFP4 cho mẫu Nemotron 3 Ultra với 550 tham số, được thiết kế để cải thiện thông lượng suy luận trong khi vẫn duy trì độ chính xác gần với phiên bản BF16 gốc và giảm đáng kể yêu cầu về bộ nhớ.
Công ty cho biết điểm kiểm tra được tạo ra bằng NVIDIA Model Optimizer sử dụng các kỹ thuật bao gồm tỷ lệ Four-over-Six và AutoQuantize. Mô hình tự động chạy dưới dạng W4A4 trên GPU Blackwell và W4A16 trên phần cứng Hopper.
Quy trình này cũng hỗ trợ lượng tử hóa phân tán với Megatron-LM, giúp giảm thời gian hiệu chỉnh trên các triển khai đa GPU. Các nhà phát triển có thể tùy chỉnh hành vi lượng tử hóa thông qua các công thức YAML hoặc các thiết lập cấu hình có sẵn cho các nhu cầu triển khai khác nhau.
NVIDIA cho biết thêm rằng quy trình lượng tử hóa, các công thức mã nguồn mở, báo cáo kỹ thuật và điểm kiểm tra NVFP4 đều có sẵn trên GitHub và Hugging Face, cho phép các nhà phát triển áp dụng quy trình tương tự cho các mô hình ngôn ngữ lớn của riêng họ.
Chia sẻ bài viết này:
Tin tức mới nhất
Stamen ra mắt nền tảng AI doanh nghiệp TUNAG AX.
0:00 30/6/26
Stamen đã công bố ra mắt TUNAG AX, một nền tảng trí tuệ nhân tạo (AI) dành cho doanh nghiệp, có sẵn từ ngày 1 tháng 7 năm 2026
Seiko Futureworks hỗ trợ hiệu đính dược phẩm bằng trí tuệ nhân tạo (AI).
0:00 30/6/26
Seiko Solutions thông báo rằng nền tảng tri thức AI của họ, Seiko Futureworks, đã được Pharma International áp dụng để hỗ trợ việc hiệu đính các tài liệu thông tin dược phẩm sau ba tháng đánh giá.
Biz Architects ra mắt nền tảng AI tiết kiệm chi phí
0:00 30/6/26
Biz Architects vừa công bố ra mắt Biz AI Works, một dịch vụ được thiết kế để xây dựng môi trường tác nhân AI bằng cách sử dụng các nền tảng doanh nghiệp hiện có của Microsoft và Google

%20(1).webp)


