top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA ra mắt mô hình lượng tử hóa Nemotron Ultra NVFP4.

Generatived

0:00 29/6/26

NVIDIA đã công bố bản cập nhật NVFP4 cho mẫu Nemotron 3 Ultra với 550 tham số, được thiết kế để cải thiện thông lượng suy luận trong khi vẫn duy trì độ chính xác gần với phiên bản BF16 gốc và giảm đáng kể yêu cầu về bộ nhớ.

Công ty cho biết điểm kiểm tra được tạo ra bằng NVIDIA Model Optimizer sử dụng các kỹ thuật bao gồm tỷ lệ Four-over-Six và AutoQuantize. Mô hình tự động chạy dưới dạng W4A4 trên GPU Blackwell và W4A16 trên phần cứng Hopper.

Quy trình này cũng hỗ trợ lượng tử hóa phân tán với Megatron-LM, giúp giảm thời gian hiệu chỉnh trên các triển khai đa GPU. Các nhà phát triển có thể tùy chỉnh hành vi lượng tử hóa thông qua các công thức YAML hoặc các thiết lập cấu hình có sẵn cho các nhu cầu triển khai khác nhau.

NVIDIA cho biết thêm rằng quy trình lượng tử hóa, các công thức mã nguồn mở, báo cáo kỹ thuật và điểm kiểm tra NVFP4 đều có sẵn trên GitHub và Hugging Face, cho phép các nhà phát triển áp dụng quy trình tương tự cho các mô hình ngôn ngữ lớn của riêng họ.

Chia sẻ bài viết này:

Tin tức mới nhất
Stamen ra mắt nền tảng AI doanh nghiệp TUNAG AX.

Stamen ra mắt nền tảng AI doanh nghiệp TUNAG AX.

0:00 30/6/26

Stamen đã công bố ra mắt TUNAG AX, một nền tảng trí tuệ nhân tạo (AI) dành cho doanh nghiệp, có sẵn từ ngày 1 tháng 7 năm 2026

Seiko Futureworks hỗ trợ hiệu đính dược phẩm bằng trí tuệ nhân tạo (AI).

Seiko Futureworks hỗ trợ hiệu đính dược phẩm bằng trí tuệ nhân tạo (AI).

0:00 30/6/26

Seiko Solutions thông báo rằng nền tảng tri thức AI của họ, Seiko Futureworks, đã được Pharma International áp dụng để hỗ trợ việc hiệu đính các tài liệu thông tin dược phẩm sau ba tháng đánh giá.

Biz Architects ra mắt nền tảng AI tiết kiệm chi phí

Biz Architects ra mắt nền tảng AI tiết kiệm chi phí

0:00 30/6/26

Biz Architects vừa công bố ra mắt Biz AI Works, một dịch vụ được thiết kế để xây dựng môi trường tác nhân AI bằng cách sử dụng các nền tảng doanh nghiệp hiện có của Microsoft và Google

Biz Freak tham gia sáng kiến ​​của Tập đoàn Trí tuệ Nhân t��ạo TOHOKU.

Biz Freak tham gia sáng kiến ​​của Tập đoàn Trí tuệ Nhân tạo TOHOKU.

0:00 30/6/26

Biz Freak thông báo đã gia nhập TOHOKU AI GROUP, một sáng kiến ​​hợp tác giữa ngành công nghiệp và giới học thuật tập trung vào Đại học Tohoku nhằm đẩy nhanh nghiên cứu trí tuệ nhân tạo

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Stamen ra mắt nền tảng AI doanh nghiệp TUNAG AX.

Stamen ra mắt nền tảng AI doanh nghiệp TUNAG AX.

0:00 30/6/26

Stamen đã công bố ra mắt TUNAG AX, một nền tảng trí tuệ nhân tạo (AI) dành cho doanh nghiệp, có sẵn từ ngày 1 tháng 7 năm 2026

Seiko Futureworks hỗ trợ hiệu đính dược phẩm bằng trí tuệ nhân tạo (AI).

Seiko Futureworks hỗ trợ hiệu đính dược phẩm bằng trí tuệ nhân tạo (AI).

0:00 30/6/26

Seiko Solutions thông báo rằng nền tảng tri thức AI của họ, Seiko Futureworks, đã được Pharma International áp dụng để hỗ trợ việc hiệu đính các tài liệu thông tin dược phẩm sau ba tháng đánh giá.

Biz Architects ra mắt nền tảng AI tiết kiệm chi phí

Biz Architects ra mắt nền tảng AI tiết kiệm chi phí

0:00 30/6/26

Biz Architects vừa công bố ra mắt Biz AI Works, một dịch vụ được thiết kế để xây dựng môi trường tác nhân AI bằng cách sử dụng các nền tảng doanh nghiệp hiện có của Microsoft và Google

Biz Freak tham gia sáng kiến ​​của Tập đoàn Trí tuệ Nhân tạo TOHOKU.

Biz Freak tham gia sáng kiến ​​của Tập đoàn Trí tuệ Nhân tạo TOHOKU.

0:00 30/6/26

Biz Freak thông báo đã gia nhập TOHOKU AI GROUP, một sáng kiến ​​hợp tác giữa ngành công nghiệp và giới học thuật tập trung vào Đại học Tohoku nhằm đẩy nhanh nghiên cứu trí tuệ nhân tạo

bottom of page