Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Cerebras ra mắt giải pháp suy luận AI nhanh chóng dành cho nhà phát triển
Generatived
9:00 28/8/24
Cerebras Systems vừa công bố giải pháp suy luận AI mới được coi là nhanh nhất thế giới. Giải pháp này có thể cung cấp 1.800 mã thông báo mỗi giây cho một mô hình AI nhất định. Hiệu suất này được cho là nhanh hơn 20 lần so với các giải pháp dựa trên GPU hiện có trong các đám mây siêu quy mô. Công ty nhấn mạnh rằng tốc độ này không làm mất đi độ chính xác, duy trì độ chính xác tối tân trong suốt quá trình suy luận.
Giám đốc điều hành của công ty nhấn mạnh thành tích này khi nói rằng Cerebras đã lập kỷ lục tốc độ mới trong tiêu chuẩn suy luận AI. Sự tiến bộ này được coi là một bước tiến quan trọng đối với các nhà phát triển cần các ứng dụng AI thời gian thực hoặc dung lượng cao. Dịch vụ suy luận được cung cấp với mức giá cạnh tranh, với mô hình trả tiền theo mức sử dụng bắt đầu từ 10 xu trên một triệu token.
Dịch vụ suy luận của Cerebras được chia thành ba cấp độ, phục vụ nhiều đối tượng người dùng từ cá nhân đến doanh nghiệp lớn. Cấp miễn phí cung cấp quyền truy cập API có giới hạn mức sử dụng rộng rãi và cấp nhà phát triển cung cấp các tùy chọn triển khai không có máy chủ hiệu quả về mặt chi phí. Cấp Doanh nghiệp được tùy chỉnh để đáp ứng khối lượng công việc ổn định với sự hỗ trợ chuyên dụng và thỏa thuận cấp độ dịch vụ tùy chỉnh.
Công ty cũng có quan hệ đối tác chiến lược để tăng tốc phát triển AI, hợp tác với nhiều công ty hàng đầu trong ngành để cung cấp các công cụ và nền tảng hỗ trợ tạo ra các ứng dụng AI. Các giải pháp suy luận của Cerebras được hỗ trợ bởi hệ thống CS-3 và Wafer Scal Engine 3, vốn có lợi thế về băng thông bộ nhớ lớn hơn so với các đối thủ cạnh tranh để cung cấp năng lượng cho các ứng dụng AI tổng hợp. Các nhà phát triển quan tâm đến dịch vụ này có thể truy cập API suy luận Cerebras, được thiết kế để dễ dàng tích hợp với các mô hình AI hiện có.
Chia sẻ bài viết này:
Tin tức mới nhất
GenAi ra mắt dịch vụ nền tảng kết nối freelancer bằng trí tuệ nhân tạo.
0:00 30/4/26
GenAi vừa thông báo ra mắt “Experts Ease”, một nền tảng mang thương hiệu kết nối các chuyên gia tư vấn tự do với các dự án AI và CNTT, mở rộng từ hoạt động khép kín trước đây.
MONO BRAIN mở rộng lĩnh vực bảo mật và phát triển AI.
0:00 30/4/26
MONO BRAIN đã công bố mở rộng nền tảng bảo mật AI của mình và ra mắt mô hình kinh doanh phát triển AI hợp tác nhằm đáp ứng nhu cầu ngày càng tăng của doanh nghiệp.
KMS tích hợp Claude Opus 4.7 vào AI
0:00 29/4/26
KMS đã công bố tích hợp “Claude Opus 4.7” vào giải pháp AI của mình được xây dựng trên Azure AI Foundry, nhằm mục đích tăng cường khả năng tự động hóa tác vụ doanh nghiệp.

%20(1).webp)


