Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Cerebras đạt được tốc độ suy luận AI đột phá

Generatived

5:00 31/1/25

"Cerebras Systems đã công bố một sự gia tăng đáng kể về hiệu suất AI, đạt được hơn 1.500 token mỗi giây trên suy luận DeepSeek-R1-Distill-Llama-70B. Tốc độ được báo cáo là nhanh hơn 57 lần so với các giải pháp dựa trên GPU hiện có, giúp tăng tốc đáng kể quá trình xử lý các tác vụ AI phức tạp. Hagay Lupesko, Phó chủ tịch cấp cao của AI Cloud tại công ty, đã nhấn mạnh đến việc chuyển đổi các quy trình suy luận dài thành các phản hồi gần như tức thời, cho biết điều này có thể thay đổi cách các nhà phát triển và doanh nghiệp tận dụng các mô hình AI tiên tiến.

Được hỗ trợ bởi Cerebras Wafer Scale Engine, nền tảng của công ty đã chứng kiến những cải tiến đáng kể về hiệu suất thực tế. Ví dụ, một lời nhắc mã hóa tiêu chuẩn mất 22 giây trên các nền tảng khác chỉ hoàn thành trong 1,5 giây trên Cerebras, thể hiện sự cải thiện 15 lần về thời gian phản hồi. Sự cải tiến này dự kiến sẽ tạo điều kiện triển khai thực tế các mô hình suy luận nâng cao thường đòi hỏi nhiều tài nguyên tính toán.

Cerebras đã tích hợp các khả năng suy luận nâng cao của mô hình Hỗn hợp chuyên gia (MoE) 671B tham số của DeepSeek vào kiến trúc Llama do Meta-developed của mình. Kích thước tham số 70B hiệu quả của mô hình vẫn vượt trội hơn các mô hình lớn hơn trong các tác vụ toán học và mã hóa phức tạp. Lupesko cũng nhấn mạnh cam kết của công ty đối với bảo mật và quyền riêng tư, lưu ý rằng tất cả các yêu cầu suy luận đều được xử lý trong các trung tâm dữ liệu tại Hoa Kỳ và có chính sách lưu giữ dữ liệu bằng không nghiêm ngặt, đảm bảo dữ liệu vẫn ở Hoa Kỳ và thuộc quyền sở hữu duy nhất của khách hàng.

Mô hình DeepSeek-R1-Distill-Llama-70B hiện có sẵn thông qua Cerebras Inference, với quyền truy cập API được cung cấp cho một số khách hàng thông qua chương trình xem trước dành cho nhà phát triển. Các bên quan tâm muốn tận dụng các khả năng suy luận tức thời này cho các ứng dụng của họ có thể truy cập trang web Cerebras để biết thêm thông tin. Cerebras Systems tiếp tục hỗ trợ nhiều khách hàng khác nhau, bao gồm các doanh nghiệp hàng đầu, viện nghiên cứu và cơ quan chính phủ, trong quá trình phát triển các mô hình và ứng dụng AI sáng tạo."

Nguồn: Thông cáo báo chí

Chia sẻ bài viết này:

Tin tức mới nhất

Microsoft mở rộng chiến lược và quan hệ đối tác về an ninh AI.

0:00 24/4/26

Microsoft cho biết những tiến bộ trong trí tuệ nhân tạo (AI) đang định hình lại các rủi ro an ninh mạng

đọc thêm

Nền tảng cơ sở hạ tầng AI của NVIDIA Google Cloud mở rộng

0:00 24/4/26

Theo các nguồn tin, NVIDIA và Google Cloud đang mở rộng sự hợp tác lâu dài của họ, tăng cường nền tảng AI toàn diện nhằm mục đích đưa trí tuệ nhân tạo (AI)

đọc thêm

OpenAI công bố mô hình bộ lọc bảo mật cho thông tin nhận dạng cá nhân (PII).

0:00 24/4/26

Theo các báo cáo, OpenAI sắp phát hành Privacy Filter, một mô hình mã nguồn mở được thiết kế để phát hiện và che giấu thông tin nhận dạng cá nhân trong văn bản

đọc thêm

OpenAI giới thiệu các tác nhân không gian làm việc nhằm nâng cao năng suất nhóm.

0:00 24/4/26

Theo các nguồn tin, OpenAI sẽ giới thiệu các tác nhân không gian làm việc trong ChatGPT, cho phép các nhóm tạo ra các tác nhân AI dùng chung để quản lý các quy trình làm

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Microsoft mở rộng chiến lược và quan hệ đối tác về an ninh AI.

0:00 24/4/26

Microsoft cho biết những tiến bộ trong trí tuệ nhân tạo (AI) đang định hình lại các rủi ro an ninh mạng

đọc thêm

Nền tảng cơ sở hạ tầng AI của NVIDIA Google Cloud mở rộng

0:00 24/4/26

Theo các nguồn tin, NVIDIA và Google Cloud đang mở rộng sự hợp tác lâu dài của họ, tăng cường nền tảng AI toàn diện nhằm mục đích đưa trí tuệ nhân tạo (AI)

đọc thêm

OpenAI công bố mô hình bộ lọc bảo mật cho thông tin nhận dạng cá nhân (PII).

0:00 24/4/26

Theo các báo cáo, OpenAI sắp phát hành Privacy Filter, một mô hình mã nguồn mở được thiết kế để phát hiện và che giấu thông tin nhận dạng cá nhân trong văn bản

đọc thêm

OpenAI giới thiệu các tác nhân không gian làm việc nhằm nâng cao năng suất nhóm.

0:00 24/4/26

Theo các nguồn tin, OpenAI sẽ giới thiệu các tác nhân không gian làm việc trong ChatGPT, cho phép các nhóm tạo ra các tác nhân AI dùng chung để quản lý các quy trình làm

đọc thêm