top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Thực hiện nhanh chóng, quy mô lớn các mô hình AI của Baseten

Generatived

0:00 19/9/25

Baseten (không rõ trụ sở chính) là nhà cung cấp cơ sở hạ tầng AI giúp các công ty khởi nghiệp chạy mô hình "nhanh" và "ở quy mô lớn". Công ty gần đây đã công bố những tiến bộ đáng kể trong việc cải thiện thông lượng và latency, hai lĩnh vực mà khách hàng coi trọng nhất.

Bằng cách tận dụng máy ảo Google Cloud A4 và Dynamic Workload Scheduler, cùng với sự hỗ trợ của NVIDIA Blackwell, công ty đã cải thiện đáng kể hiệu suất suy luận, đạt mức cải thiện 225% về hiệu suất chi phí cho suy luận tập trung vào thông lượng và cải thiện 25% về suy luận tập trung vào độ trễ.

Tiến bộ công nghệ này sẽ cho phép các công ty đưa các mô hình AI và suy luận mạnh mẽ vào sản xuất một cách tiết kiệm chi phí, cho phép AI giọng nói thời gian thực, AI tìm kiếm, quy trình làm việc của tác nhân, v.v. ở quy mô và chi phí chưa từng có.

Baseten, hợp tác với Google Cloud và NVIDIA, cung cấp một nền tảng suy luận tập trung vào hiệu suất và hiệu quả chi phí. Thành công của công ty nằm ở chiến lược tận dụng tối đa phần cứng tiên tiến và phối hợp chúng với một bộ phần mềm được tối ưu hóa cao. Chi tiết được cung cấp trong bài đăng trên blog của Baseten.

Chia sẻ bài viết này:

Tin tức mới nhất
Thực hiện nhanh chóng, quy mô lớn các mô hình AI của Baseten

Thực hiện nhanh chóng, quy mô lớn các mô hình AI của Baseten

0:00 19/9/25

Baseten (không rõ trụ sở chính) là nhà cung cấp cơ sở hạ tầng AI giúp các công ty khởi nghiệp chạy mô hình "nhanh chóng" và "ở quy mô lớn".

Google Cloud tập trung vào việc tăng cường bảo mật AI

Google Cloud tập trung vào việc tăng cường bảo mật AI

0:00 19/9/25

Google Cloud (California, Hoa Kỳ) cam kết thúc đẩy AI an toàn, coi bảo mật của hệ thống AI là yếu tố thiết yếu để duy trì hoạt động kinh doanh và tạo niềm tin cho khách hàng.

Dịch vụ lễ tân tự động AI của NTT East ra mắt vào năm 2025

Dịch vụ lễ tân tự động AI của NTT East ra mắt vào năm 2025

0:00 19/9/25

NTT East (Shinjuku-ku, Tokyo) sẽ triển khai hệ thống tiếp nhận tự động sử dụng công nghệ Generative AI để báo cáo các thiết bị không an toàn như dây điện thoại bị chùng và cột điện bị hư hỏng

NVIDIA tăng cường AI bằng công nghệ giải mã suy đoán

NVIDIA tăng cường AI bằng công nghệ giải mã suy đoán

0:00 19/9/25

Trong lĩnh vực trí tuệ nhân tạo, hiệu quả cải thiện của các mô hình ngôn ngữ lớn (LLM) đạt được thông qua một kỹ thuật gọi là giải mã suy đoán.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Thực hiện nhanh chóng, quy mô lớn các mô hình AI của Baseten

Thực hiện nhanh chóng, quy mô lớn các mô hình AI của Baseten

0:00 19/9/25

Baseten (không rõ trụ sở chính) là nhà cung cấp cơ sở hạ tầng AI giúp các công ty khởi nghiệp chạy mô hình "nhanh chóng" và "ở quy mô lớn".

Google Cloud tập trung vào việc tăng cường bảo mật AI

Google Cloud tập trung vào việc tăng cường bảo mật AI

0:00 19/9/25

Google Cloud (California, Hoa Kỳ) cam kết thúc đẩy AI an toàn, coi bảo mật của hệ thống AI là yếu tố thiết yếu để duy trì hoạt động kinh doanh và tạo niềm tin cho khách hàng.

Dịch vụ lễ tân tự động AI của NTT East ra mắt vào năm 2025

Dịch vụ lễ tân tự động AI của NTT East ra mắt vào năm 2025

0:00 19/9/25

NTT East (Shinjuku-ku, Tokyo) sẽ triển khai hệ thống tiếp nhận tự động sử dụng công nghệ Generative AI để báo cáo các thiết bị không an toàn như dây điện thoại bị chùng và cột điện bị hư hỏng

NVIDIA tăng cường AI bằng công nghệ giải mã suy đoán

NVIDIA tăng cường AI bằng công nghệ giải mã suy đoán

0:00 19/9/25

Trong lĩnh vực trí tuệ nhân tạo, hiệu quả cải thiện của các mô hình ngôn ngữ lớn (LLM) đạt được thông qua một kỹ thuật gọi là giải mã suy đoán.

bottom of page