Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Thực hiện nhanh chóng, quy mô lớn các mô hình AI của Baseten
Generatived
0:00 19/9/25
Baseten (không rõ trụ sở chính) là nhà cung cấp cơ sở hạ tầng AI giúp các công ty khởi nghiệp chạy mô hình "nhanh" và "ở quy mô lớn". Công ty gần đây đã công bố những tiến bộ đáng kể trong việc cải thiện thông lượng và latency, hai lĩnh vực mà khách hàng coi trọng nhất.
Bằng cách tận dụng máy ảo Google Cloud A4 và Dynamic Workload Scheduler, cùng với sự hỗ trợ của NVIDIA Blackwell, công ty đã cải thiện đáng kể hiệu suất suy luận, đạt mức cải thiện 225% về hiệu suất chi phí cho suy luận tập trung vào thông lượng và cải thiện 25% về suy luận tập trung vào độ trễ.
Tiến bộ công nghệ này sẽ cho phép các công ty đưa các mô hình AI và suy luận mạnh mẽ vào sản xuất một cách tiết kiệm chi phí, cho phép AI giọng nói thời gian thực, AI tìm kiếm, quy trình làm việc của tác nhân, v.v. ở quy mô và chi phí chưa từng có.
Baseten, hợp tác với Google Cloud và NVIDIA, cung cấp một nền tảng suy luận tập trung vào hiệu suất và hiệu quả chi phí. Thành công của công ty nằm ở chiến lược tận dụng tối đa phần cứng tiên tiến và phối hợp chúng với một bộ phần mềm được tối ưu hóa cao. Chi tiết được cung cấp trong bài đăng trên blog của Baseten.
Chia sẻ bài viết này:
Tin tức mới nhất
Thực hiện nhanh chóng, quy mô lớn các mô hình AI của Baseten
0:00 19/9/25
Baseten (không rõ trụ sở chính) là nhà cung cấp cơ sở hạ tầng AI giúp các công ty khởi nghiệp chạy mô hình "nhanh chóng" và "ở quy mô lớn".
Google Cloud tập trung vào việc tăng cường bảo mật AI
0:00 19/9/25
Google Cloud (California, Hoa Kỳ) cam kết thúc đẩy AI an toàn, coi bảo mật của hệ thống AI là yếu tố thiết yếu để duy trì hoạt động kinh doanh và tạo niềm tin cho khách hàng.
Dịch vụ lễ tân tự động AI của NTT East ra mắt vào năm 2025
0:00 19/9/25
NTT East (Shinjuku-ku, Tokyo) sẽ triển khai hệ thống tiếp nhận tự động sử dụng công nghệ Generative AI để báo cáo các thiết bị không an toàn như dây điện thoại bị chùng và cột điện bị hư hỏng
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
Thực hiện nhanh chóng, quy mô lớn các mô hình AI của Baseten
0:00 19/9/25
Baseten (không rõ trụ sở chính) là nhà cung cấp cơ sở hạ tầng AI giúp các công ty khởi nghiệp chạy mô hình "nhanh chóng" và "ở quy mô lớn".
Google Cloud tập trung vào việc tăng cường bảo mật AI
0:00 19/9/25
Google Cloud (California, Hoa Kỳ) cam kết thúc đẩy AI an toàn, coi bảo mật của hệ thống AI là yếu tố thiết yếu để duy trì hoạt động kinh doanh và tạo niềm tin cho khách hàng.
Dịch vụ lễ tân tự động AI của NTT East ra mắt vào năm 2025
0:00 19/9/25
NTT East (Shinjuku-ku, Tokyo) sẽ triển khai hệ thống tiếp nhận tự động sử dụng công nghệ Generative AI để báo cáo các thiết bị không an toàn như dây điện thoại bị chùng và cột điện bị hư hỏng