top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA tăng cường nền tảng AI để nâng cao hiệu quả.

Generatived

0:00 14/1/26

NVIDIA đã và đang tích cực nâng cao nền tảng AI của mình để cải thiện hiệu suất xử lý token trên mỗi watt, một chỉ số quan trọng về hiệu quả chi phí trong hoạt động AI. Bằng cách tối ưu hóa sự phối hợp giữa GPU, CPU, mạng, phần mềm, hệ thống cấp điện và hệ thống làm mát, chúng tôi đã thành công trong việc giảm chi phí trên mỗi triệu token được tạo ra. Sự cải thiện này sẽ đặc biệt có lợi khi ngày càng nhiều người dùng, từ người tiêu dùng cá nhân đến các doanh nghiệp lớn, tận dụng AI cho nhiều nhiệm vụ khác nhau.

Những tiến bộ của NVIDIA cũng mở rộng đến bộ phần mềm của hãng, đã được tinh chỉnh để khai thác hiệu suất cao hơn từ nền tảng hiện có. Chiến lược này không chỉ cải thiện hiệu suất của GPU NVIDIA mà còn kéo dài tuổi thọ hữu ích của cơ sở hạ tầng đã được triển khai bởi các nhà cung cấp dịch vụ đám mây, đám mây GPU, nhà xây dựng mô hình và doanh nghiệp.

Các bản cập nhật gần đây cho bộ phần mềm suy luận của NVIDIA đã mang lại những cải tiến hiệu suất đáng kể, đặc biệt khi chạy trên kiến trúc NVIDIA Blackwell. Những bản cập nhật này, cùng với đầy đủ chức năng của bộ phần mềm, đã góp phần đáng kể vào việc cải thiện hiệu suất của DeepSeek-R1, một mô hình suy luận hỗn hợp thưa thớt phức tạp của các chuyên gia.

Nền tảng NVIDIA GB200 NVL72 quy mô rack, với 72 GPU NVIDIA Blackwell, thể hiện cam kết của NVIDIA trong việc tối ưu hóa hiệu năng AI. Thiết kế của nền tảng được tùy chỉnh cho các mô hình dựa trên kiến trúc MoE thưa, vốn yêu cầu trao đổi dữ liệu thường xuyên. Các tối ưu hóa như tăng tốc phần cứng cho định dạng dữ liệu NVFP4 của kiến trúc Blackwell và phân phối dữ liệu giúp tận dụng tối đa kiến trúc NVL72 và công nghệ chuyển mạch NVLink để mang lại hiệu năng cao nhất cho các mô hình như DeepSeek-R1.

Chia sẻ bài viết này:

Tin tức mới nhất
NVIDIA công bố TensorRT Edge-LLM để tăng cường trí tuệ nhân tạo (AI).

NVIDIA công bố TensorRT Edge-LLM để tăng cường trí tuệ nhân tạo (AI).

0:00 14/1/26

NVIDIA đã công bố TensorRT Edge-LLM, một khung phần mềm mã nguồn mở C++ mới được thiết kế để cải thiện hiệu suất của các mô hình ngôn ngữ quy mô lớn (LLM)

DeepSeek báo cáo sự gia tăng nhanh chóng trong việc áp dụng Generative AI trên toàn cầu.

DeepSeek báo cáo sự gia tăng nhanh chóng trong việc áp dụng Generative AI trên toàn cầu.

0:00 14/1/26

Theo số liệu thống kê mới nhất, việc ứng dụng trí tuệ nhân tạo (AI) trên toàn cầu đang tăng đều đặn, dự kiến sẽ tăng 1,2 điểm phần trăm vào nửa cuối năm 2025.

Phòng thí nghiệm quốc gia Lawrence Berkeley ra mắt tr�ợ lý AI cho máy gia tốc

Phòng thí nghiệm quốc gia Lawrence Berkeley ra mắt trợ lý AI cho máy gia tốc

0:00 14/1/26

Giữa khung cảnh tuyệt đẹp của Berkeley, California, một hệ thống trí tuệ nhân tạo (AI) đang nâng cao hiệu quả của các thí nghiệm vật lý rủi ro cao tại máy gia tốc hạt nổi tiếng.

Nền tảng NVIDIA AI Blueprint hỗ trợ mạnh mẽ cho các danh mục sản phẩm thương mại điện tử.

Nền tảng NVIDIA AI Blueprint hỗ trợ mạnh mẽ cho các danh mục sản phẩm thương mại điện tử.

0:00 14/1/26

Các danh mục thương mại điện tử thường bị hạn chế bởi thông tin sản phẩm ít ỏi, ảnh hưởng đến khả năng hiển thị sản phẩm và sự tương tác của khách hàng.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
NVIDIA công bố TensorRT Edge-LLM để tăng cường trí tuệ nhân tạo (AI).

NVIDIA công bố TensorRT Edge-LLM để tăng cường trí tuệ nhân tạo (AI).

0:00 14/1/26

NVIDIA đã công bố TensorRT Edge-LLM, một khung phần mềm mã nguồn mở C++ mới được thiết kế để cải thiện hiệu suất của các mô hình ngôn ngữ quy mô lớn (LLM)

DeepSeek báo cáo sự gia tăng nhanh chóng trong việc áp dụng Generative AI trên toàn cầu.

DeepSeek báo cáo sự gia tăng nhanh chóng trong việc áp dụng Generative AI trên toàn cầu.

0:00 14/1/26

Theo số liệu thống kê mới nhất, việc ứng dụng trí tuệ nhân tạo (AI) trên toàn cầu đang tăng đều đặn, dự kiến sẽ tăng 1,2 điểm phần trăm vào nửa cuối năm 2025.

Phòng thí nghiệm quốc gia Lawrence Berkeley ra mắt trợ lý AI cho máy gia tốc

Phòng thí nghiệm quốc gia Lawrence Berkeley ra mắt trợ lý AI cho máy gia tốc

0:00 14/1/26

Giữa khung cảnh tuyệt đẹp của Berkeley, California, một hệ thống trí tuệ nhân tạo (AI) đang nâng cao hiệu quả của các thí nghiệm vật lý rủi ro cao tại máy gia tốc hạt nổi tiếng.

Nền tảng NVIDIA AI Blueprint hỗ trợ mạnh mẽ cho các danh mục sản phẩm thương mại điện tử.

Nền tảng NVIDIA AI Blueprint hỗ trợ mạnh mẽ cho các danh mục sản phẩm thương mại điện tử.

0:00 14/1/26

Các danh mục thương mại điện tử thường bị hạn chế bởi thông tin sản phẩm ít ỏi, ảnh hưởng đến khả năng hiển thị sản phẩm và sự tương tác của khách hàng.

bottom of page