Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo
%20(1).webp)
NVIDIA nhấn mạnh chi phí token cho cơ sở hạ tầng AI
Generatived
0:00 20/4/26
NVIDIA cho biết các trung tâm dữ liệu đang chuyển dịch sang “các nhà máy token AI”, nơi các tác vụ suy luận chiếm ưu thế và sản lượng được đo bằng token thay vì năng lực tính toán thô.
Công ty này chỉ ra rằng các chỉ số truyền thống như chi phí tính toán và FLOPS trên mỗi đô la không thể phản ánh hiệu suất thực tế. Họ nhấn mạnh chi phí trên mỗi token là chỉ số quan trọng cho kinh tế cơ sở hạ tầng AI.
Theo phân tích, việc tối đa hóa sản lượng token trực tiếp làm giảm chi phí và tăng tiềm năng doanh thu. Các yếu tố như thông lượng, hiệu quả năng lượng và tối ưu hóa phần mềm ảnh hưởng đáng kể đến kết quả triển khai thực tế.
So sánh cho thấy các hệ thống Blackwell mới hơn mang lại hiệu quả token cao hơn nhiều so với các kiến trúc trước đó, dẫn đến chi phí trên mỗi token thấp hơn đáng kể. Sự chuyển dịch này báo hiệu một sự thay đổi rộng hơn trong cách các doanh nghiệp đánh giá cơ sở hạ tầng AI.
Chia sẻ bài viết này:
Tin tức mới nhất
OpenAI ra mắt ChatGPT cho các bác sĩ lâm sàng, cung cấp quyền truy cập miễn phí.
0:00 24/4/26
Theo các báo cáo, OpenAI đã ra mắt ChatGPT dành cho các bác sĩ lâm sàng, cung cấp quyền truy cập miễn phí vào các chuyên gia chăm sóc sức khỏe đã được xác minh tại
Salary Up Lab ra mắt giải pháp đánh giá nhân sự bằng AI.
0:00 24/4/26
Salary Up Lab vừa công bố ra mắt dịch vụ đánh giá nhân sự dựa trên trí tuệ nhân tạo, được thiết kế để hỗ trợ các công ty từ khâu thiết kế hệ thống đến vận hành và cải tiến liên tục.
Hệ thống Heptagon AI Minutes giúp giảm thời gian làm việc.
0:00 24/4/26
Theo các nguồn tin, Heptagon đã hỗ trợ một đài truyền hình khu vực triển khai hệ thống trí tuệ nhân tạo tạo sinh để ghi chép biên bản cuộc họp


%20(1).webp)

