top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA công bố NVFP4 nhằm Enhance AI.

Generatived

0:00 10/2/26

NVIDIA đang tích cực theo đuổi thiết kế đồng bộ cực đỉnh để đáp ứng nhu cầu ngày càng tăng về hiệu năng tính toán AI với tốc độ vượt xa dự đoán của Định luật Moore. Bằng cách thiết kế trên nhiều chip và một môi trường phần mềm rộng lớn, NVIDIA đặt mục tiêu cải thiện đáng kể hiệu năng và hiệu quả của nhà máy AI. Việc giới thiệu các định dạng AI độ chính xác thấp như NVFP4 là trọng tâm của chiến lược này, giúp cải thiện hiệu năng tính toán và hiệu quả năng lượng trong khi vẫn duy trì độ chính xác cao.

Định dạng NVFP4, được trang bị trên các GPU NVIDIA từ dòng Blackwell trở đi, mang lại lợi ích của độ chính xác dấu phẩy động 4 bit. Sự đổi mới này không chỉ duy trì độ chính xác tương đương với các định dạng độ chính xác cao, mà còn mang lại những cải tiến hiệu suất đáng kể trong quá trình huấn luyện và suy luận AI. Ví dụ, GPU Blackwell Ultra đạt được thông lượng NVFP4 lên đến 15 petaFLOPS, mang lại hiệu suất gấp ba lần so với độ chính xác FP8 trên cùng phần cứng. Sự cải tiến này vượt xa các thông số kỹ thuật lý thuyết tối đa và thể hiện rõ ràng trong hiệu suất thực tế đối với các tác vụ huấn luyện và suy luận.

Sự cam kết của NVIDIA đối với độ chính xác của NVFP4 được thể hiện qua nhiều thành công trong các hạng mục khép kín của bộ dữ liệu huấn luyện và suy luận MLPerf. Các bộ dữ liệu này yêu cầu các mô hình phải đáp ứng các ngưỡng độ chính xác cụ thể, và các mô hình của NVIDIA sử dụng NVFP4 trên GPU Blackwell và Blackwell Ultra đã đáp ứng các tiêu chuẩn khắt khe này cho nhiều mô hình ngôn ngữ quy mô lớn. Thành tựu này chứng minh khả năng của NVFP4 trong việc mang lại độ chính xác cao trong các đánh giá tiêu chuẩn ngành.

Định dạng NVFP4 đang được áp dụng rộng rãi trong toàn bộ hệ sinh thái, nhờ sự hỗ trợ từ các thư viện và framework cho phép các nhà phát triển lượng tử hóa mô hình của họ sang NVFP4 trong khi vẫn duy trì độ chính xác. Việc áp dụng rộng rãi này đang thúc đẩy tăng thông lượng suy luận trong môi trường sản xuất cho nhiều loại mô hình khác nhau. Các công ty như Black Forest Labs, Radical Numerics, Cognition và Red Hat đang tận dụng NVFP4 để cải thiện hiệu suất và hiệu quả trong việc triển khai AI. NVIDIA tiếp tục đổi mới và hợp tác với hệ sinh thái để mở rộng lợi ích của việc huấn luyện NVFP4 và đặt nền tảng cho việc phát triển các mô hình AI thông minh hơn, phức tạp hơn.

Chia sẻ bài viết này:

Tin tức mới nhất
AP Communications bắt đầu h��ỗ trợ tuyển dụng bằng trí tuệ nhân tạo.

AP Communications bắt đầu hỗ trợ tuyển dụng bằng trí tuệ nhân tạo.

0:00 10/2/26

Công ty AP Communications (Chiyoda-ku, Tokyo) đã giới thiệu "Trợ lý Tuyển dụng exaBase", do Exa Enterprise AI (Minato-ku, Tokyo), một công ty con của ExaWizards cung cấp.

DATUM STUDIO Chứng nhận ELITE cấp cao nhất Snowflake

DATUM STUDIO Chứng nhận ELITE cấp cao nhất Snowflake

0:00 10/2/26

DATUM STUDIO (Meguro-ku, Tokyo) thông báo đã được chứng nhận là đối tác dịch vụ điện toán đám mây dữ liệu AI cao cấp nhất của Snowflake, cấp độ "ELITE".

GBP thành lập bộ phận đo lường điện năng cho trung tâm dữ liệu AI mới.

GBP thành lập bộ phận đo lường điện năng cho trung tâm dữ liệu AI mới.

0:00 10/2/26

GBP (Tokyo) đã thành lập một bộ phận mới chuyên về các vấn đề cung cấp điện cho trung tâm dữ liệu trong kỷ nguyên AI.

Dịch thuật đồng thời bằng AI giúp giảm đáng kể thời gian giao hàng.

Dịch thuật đồng thời bằng AI giúp giảm đáng kể thời gian giao hàng.

0:00 10/2/26

Simul (Chuo-ku, Tokyo) thông báo sẽ ra mắt dịch vụ mới, "Dịch vụ Dịch thuật Thuyết trình AI", vào tháng 2 năm 2026.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
AP Communications bắt đầu hỗ trợ tuyển dụng bằng trí tuệ nhân tạo.

AP Communications bắt đầu hỗ trợ tuyển dụng bằng trí tuệ nhân tạo.

0:00 10/2/26

Công ty AP Communications (Chiyoda-ku, Tokyo) đã giới thiệu "Trợ lý Tuyển dụng exaBase", do Exa Enterprise AI (Minato-ku, Tokyo), một công ty con của ExaWizards cung cấp.

DATUM STUDIO Chứng nhận ELITE cấp cao nhất Snowflake

DATUM STUDIO Chứng nhận ELITE cấp cao nhất Snowflake

0:00 10/2/26

DATUM STUDIO (Meguro-ku, Tokyo) thông báo đã được chứng nhận là đối tác dịch vụ điện toán đám mây dữ liệu AI cao cấp nhất của Snowflake, cấp độ "ELITE".

GBP thành lập bộ phận đo lường điện năng cho trung tâm dữ liệu AI mới.

GBP thành lập bộ phận đo lường điện năng cho trung tâm dữ liệu AI mới.

0:00 10/2/26

GBP (Tokyo) đã thành lập một bộ phận mới chuyên về các vấn đề cung cấp điện cho trung tâm dữ liệu trong kỷ nguyên AI.

Dịch thuật đồng thời bằng AI giúp giảm đáng kể thời gian giao hàng.

Dịch thuật đồng thời bằng AI giúp giảm đáng kể thời gian giao hàng.

0:00 10/2/26

Simul (Chuo-ku, Tokyo) thông báo sẽ ra mắt dịch vụ mới, "Dịch vụ Dịch thuật Thuyết trình AI", vào tháng 2 năm 2026.

bottom of page