top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA công bố NVFP4 nhằm Enhance AI.

Generatived

0:00 10/2/26

NVIDIA đang tích cực theo đuổi thiết kế đồng bộ cực đỉnh để đáp ứng nhu cầu ngày càng tăng về hiệu năng tính toán AI với tốc độ vượt xa dự đoán của Định luật Moore. Bằng cách thiết kế trên nhiều chip và một môi trường phần mềm rộng lớn, NVIDIA đặt mục tiêu cải thiện đáng kể hiệu năng và hiệu quả của nhà máy AI. Việc giới thiệu các định dạng AI độ chính xác thấp như NVFP4 là trọng tâm của chiến lược này, giúp cải thiện hiệu năng tính toán và hiệu quả năng lượng trong khi vẫn duy trì độ chính xác cao.

Định dạng NVFP4, được trang bị trên các GPU NVIDIA từ dòng Blackwell trở đi, mang lại lợi ích của độ chính xác dấu phẩy động 4 bit. Sự đổi mới này không chỉ duy trì độ chính xác tương đương với các định dạng độ chính xác cao, mà còn mang lại những cải tiến hiệu suất đáng kể trong quá trình huấn luyện và suy luận AI. Ví dụ, GPU Blackwell Ultra đạt được thông lượng NVFP4 lên đến 15 petaFLOPS, mang lại hiệu suất gấp ba lần so với độ chính xác FP8 trên cùng phần cứng. Sự cải tiến này vượt xa các thông số kỹ thuật lý thuyết tối đa và thể hiện rõ ràng trong hiệu suất thực tế đối với các tác vụ huấn luyện và suy luận.

Sự cam kết của NVIDIA đối với độ chính xác của NVFP4 được thể hiện qua nhiều thành công trong các hạng mục khép kín của bộ dữ liệu huấn luyện và suy luận MLPerf. Các bộ dữ liệu này yêu cầu các mô hình phải đáp ứng các ngưỡng độ chính xác cụ thể, và các mô hình của NVIDIA sử dụng NVFP4 trên GPU Blackwell và Blackwell Ultra đã đáp ứng các tiêu chuẩn khắt khe này cho nhiều mô hình ngôn ngữ quy mô lớn. Thành tựu này chứng minh khả năng của NVFP4 trong việc mang lại độ chính xác cao trong các đánh giá tiêu chuẩn ngành.

Định dạng NVFP4 đang được áp dụng rộng rãi trong toàn bộ hệ sinh thái, nhờ sự hỗ trợ từ các thư viện và framework cho phép các nhà phát triển lượng tử hóa mô hình của họ sang NVFP4 trong khi vẫn duy trì độ chính xác. Việc áp dụng rộng rãi này đang thúc đẩy tăng thông lượng suy luận trong môi trường sản xuất cho nhiều loại mô hình khác nhau. Các công ty như Black Forest Labs, Radical Numerics, Cognition và Red Hat đang tận dụng NVFP4 để cải thiện hiệu suất và hiệu quả trong việc triển khai AI. NVIDIA tiếp tục đổi mới và hợp tác với hệ sinh thái để mở rộng lợi ích của việc huấn luyện NVFP4 và đặt nền tảng cho việc phát triển các mô hình AI thông minh hơn, phức tạp hơn.

Chia sẻ bài viết này:

Tin tức mới nhất
Tài liệu phát triển phương thức thanh toán hỗ trợ AI cho GMO-PG

Tài liệu phát triển phương thức thanh toán hỗ trợ AI cho GMO-PG

0:00 6/2/26

GMO-PG (Shibuya-ku, Tokyo) đã trở thành nhà cung cấp dịch vụ thanh toán (PSP) đầu tiên tại Nhật Bản thiết lập nền tảng tài liệu cho môi trường phát triển thanh toán của mình hướng tới

Sansan và Figma cải thiện trải nghiệm phát triển AI.

Sansan và Figma cải thiện trải nghiệm phát triển AI.

0:00 6/2/26

Figma(Chiyoda-ku, Tokyo) thông báo rằng Sansan (Shibuya-ku, Tokyo) đã giới thiệu Figma MCP Server, cho phép trải nghiệm phát triển được hỗ trợ bởi trí tuệ nhân tạo (AI).

Sky mở rộng lĩnh vực trí tuệ nhân tạo với Google Gemini.

Sky mở rộng lĩnh vực trí tuệ nhân tạo với Google Gemini.

0:00 6/2/26

Sky (trụ sở chính) đã giới thiệu Gemini Enterprise của Google LLC và thông báo sẽ bắt đầu sử dụng nội bộ theo từng giai đoạn từ tháng 1 năm 2026.

Intel AI PC Kỷ nguyên mới Mở rộng thị trường Nhật Bản 2026

Intel AI PC Kỷ nguyên mới Mở rộng thị trường Nhật Bản 2026

0:00 6/2/26

Intel (California) đã tổ chức sự kiện "Intel Connection Japan 2026" để giới thiệu kỷ nguyên máy tính AI và các sáng kiến ​​của mình.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Tài liệu phát triển phương thức thanh toán hỗ trợ AI cho GMO-PG

Tài liệu phát triển phương thức thanh toán hỗ trợ AI cho GMO-PG

0:00 6/2/26

GMO-PG (Shibuya-ku, Tokyo) đã trở thành nhà cung cấp dịch vụ thanh toán (PSP) đầu tiên tại Nhật Bản thiết lập nền tảng tài liệu cho môi trường phát triển thanh toán của mình hướng tới

Sansan và Figma cải thiện trải nghiệm phát triển AI.

Sansan và Figma cải thiện trải nghiệm phát triển AI.

0:00 6/2/26

Figma(Chiyoda-ku, Tokyo) thông báo rằng Sansan (Shibuya-ku, Tokyo) đã giới thiệu Figma MCP Server, cho phép trải nghiệm phát triển được hỗ trợ bởi trí tuệ nhân tạo (AI).

Sky mở rộng lĩnh vực trí tuệ nhân tạo với Google Gemini.

Sky mở rộng lĩnh vực trí tuệ nhân tạo với Google Gemini.

0:00 6/2/26

Sky (trụ sở chính) đã giới thiệu Gemini Enterprise của Google LLC và thông báo sẽ bắt đầu sử dụng nội bộ theo từng giai đoạn từ tháng 1 năm 2026.

Intel AI PC Kỷ nguyên mới Mở rộng thị trường Nhật Bản 2026

Intel AI PC Kỷ nguyên mới Mở rộng thị trường Nhật Bản 2026

0:00 6/2/26

Intel (California) đã tổ chức sự kiện "Intel Connection Japan 2026" để giới thiệu kỷ nguyên máy tính AI và các sáng kiến ​​của mình.

bottom of page