Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Gemini phát hành chế độ hàng loạt API mới cho các tác vụ khối lượng lớn
Generatived
0:00 9/7/25
Gemini đã công bố việc giới thiệu chế độ hàng loạt mới cho API, dành cho các tác vụ khối lượng lớn, không khẩn cấp. Điểm cuối không đồng bộ này cho phép người dùng gửi số lượng lớn công việc, quản lý việc thực hiện từ xa và nhận kết quả trong vòng một ngày, tất cả chỉ bằng một nửa chi phí của API đồng bộ tiêu chuẩn.
Chế độ hàng loạt lý tưởng cho các tình huống mà dữ liệu được chuẩn bị trước và phản hồi ngay lập tức không phải là yếu tố quan trọng. Các tác vụ hàng loạt được cung cấp với mức giá bằng một nửa mức giá thông thường, cho phép người dùng tiết kiệm chi phí đáng kể. Ngoài ra, chế độ này đơn giản hóa các tương tác API bằng cách hỗ trợ giới hạn tốc độ cao và loại bỏ nhu cầu về cơ chế xếp hàng và thử lại phức tạp ở phía máy khách, cho phép bạn nhận được kết quả trong vòng 24 giờ.
API của Gemini được thiết kế để dễ sử dụng, cho phép các nhà phát triển gom các yêu cầu vào một tệp duy nhất, gửi chúng và thu thập kết quả sau. Ví dụ, Reforged Labs sử dụng các mô hình Gemini 2.5 Pro ở chế độ hàng loạt để phân tích và phân loại khối lượng lớn quảng cáo video hàng tháng, giúp giảm chi phí, phân phối chúng đến khách hàng nhanh hơn và cung cấp khả năng mở rộng cần thiết cho phân tích thị trường nghiêm túc. Tương tự như vậy, Vals AI sử dụng chế độ hàng loạt để đánh giá các mô hình nền tảng một cách rộng rãi trên nhiều lĩnh vực, bao gồm pháp lý và chăm sóc sức khỏe, mà không giới hạn tỷ lệ.
Chia sẻ bài viết này:

%20(1).webp)
%20(1).webp)