Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA ra mắt mô hình lượng tử hóa Nemotron Ultra NVFP4.
Generatived
0:00 29/6/26
NVIDIA đã công bố bản cập nhật NVFP4 cho mẫu Nemotron 3 Ultra với 550 tham số, được thiết kế để cải thiện thông lượng suy luận trong khi vẫn duy trì độ chính xác gần với phiên bản BF16 gốc và giảm đáng kể yêu cầu về bộ nhớ.
Công ty cho biết điểm kiểm tra được tạo ra bằng NVIDIA Model Optimizer sử dụng các kỹ thuật bao gồm tỷ lệ Four-over-Six và AutoQuantize. Mô hình tự động chạy dưới dạng W4A4 trên GPU Blackwell và W4A16 trên phần cứng Hopper.
Quy trình này cũng hỗ trợ lượng tử hóa phân tán với Megatron-LM, giúp giảm thời gian hiệu chỉnh trên các triển khai đa GPU. Các nhà phát triển có thể tùy chỉnh hành vi lượng tử hóa thông qua các công thức YAML hoặc các thiết lập cấu hình có sẵn cho các nhu cầu triển khai khác nhau.
NVIDIA cho biết thêm rằng quy trình lượng tử hóa, các công thức mã nguồn mở, báo cáo kỹ thuật và điểm kiểm tra NVFP4 đều có sẵn trên GitHub và Hugging Face, cho phép các nhà phát triển áp dụng quy trình tương tự cho các mô hình ngôn ngữ lớn của riêng họ.
Chia sẻ bài viết này:
Tin tức mới nhất
Bakura phát hành hướng dẫn chuẩn bị quảng cáo ChatGPT.
0:00 30/6/26
Bakuri và Dr.AISEO đã cùng nhau công bố một hướng dẫn dành cho các nhà quảng cáo và đại lý chuẩn bị cho quảng cáo ChatGPT
Preferred ra mắt dịch vụ hỗ trợ bảo mật ứng dụng AI.
0:00 30/6/26
Preferred và Maitrasys đã công bố bản xem trước của Omakase AI Guard, một dịch vụ hỗ trợ bảo mật được thiết kế để giúp các tổ chức triển khai
Comix mở rộng dịch vụ hỗ trợ tự động hóa tuyển dụng bằng AI.
0:00 30/6/26
Comix vừa thông báo mở rộng dịch vụ hỗ trợ AI cho các công ty tuyển dụng, giới thiệu quy trình tự động tạo bản nháp thư giới thiệu ứng viên từ bản ghi âm phỏng vấn bằng AI tạo sinh.
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
Bakura phát hành hướng dẫn chuẩn bị quảng cáo ChatGPT.
0:00 30/6/26
Bakuri và Dr.AISEO đã cùng nhau công bố một hướng dẫn dành cho các nhà quảng cáo và đại lý chuẩn bị cho quảng cáo ChatGPT
Preferred ra mắt dịch vụ hỗ trợ bảo mật ứng dụng AI.
0:00 30/6/26
Preferred và Maitrasys đã công bố bản xem trước của Omakase AI Guard, một dịch vụ hỗ trợ bảo mật được thiết kế để giúp các tổ chức triển khai
Comix mở rộng dịch vụ hỗ trợ tự động hóa tuyển dụng bằng AI.
0:00 30/6/26
Comix vừa thông báo mở rộng dịch vụ hỗ trợ AI cho các công ty tuyển dụng, giới thiệu quy trình tự động tạo bản nháp thư giới thiệu ứng viên từ bản ghi âm phỏng vấn bằng AI tạo sinh.


%20(1).webp)



