Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Mô hình DeepSeek V4 cho phép trí tuệ nhân tạo với hàng triệu token
Generatived
0:00 27/4/26
DeepSeek vừa giới thiệu hai mẫu sản phẩm chủ lực thế hệ thứ tư của mình, DeepSeek-V4-Pro và DeepSeek-V4-Flash, cả hai đều hỗ trợ cửa sổ ngữ cảnh lên đến 1 triệu token. Phiên bản này nhắm đến các trường hợp sử dụng suy luận ngữ cảnh dài nâng cao như lập trình, phân tích tài liệu, truy xuất và quy trình làm việc AI dựa trên tác nhân.
DeepSeek-V4-Pro có tổng cộng 1,6 nghìn tỷ tham số với 49 tỷ tham số hoạt động, trong khi V4-Flash là mô hình nhỏ hơn với 284 tỷ tham số được tối ưu hóa cho tốc độ và hiệu quả. Cả hai mô hình đều hỗ trợ đầu ra lên đến 384K token, cho phép suy luận đa bước phức tạp và tạo ra các dạng văn bản dài.
Về mặt kiến trúc, dòng V4 giới thiệu các cơ chế chú ý lai giúp giảm đáng kể chi phí tính toán và mức sử dụng bộ nhớ. Bằng cách kết hợp các kỹ thuật chú ý nén và thưa, các mô hình đạt được mức giảm tới 90% bộ nhớ cache KV và cải thiện hiệu quả suy luận so với các phiên bản trước.
Các bài kiểm tra hiệu năng trên hệ thống NVIDIA Blackwell cho thấy thông lượng mạnh mẽ và latency thấp, hỗ trợ triển khai quy mô doanh nghiệp. Các mô hình này được định vị để thúc đẩy sự chuyển đổi sang các tác nhân AI đa bước, ngữ cảnh dài và các hệ thống thông minh quy mô lớn.
Chia sẻ bài viết này:
Tin tức mới nhất
OpenAI ra mắt công ty hỗ trợ triển khai AI.
0:00 15/5/26
OpenAI vừa công bố ra mắt OpenAI Deployment Company, một doanh nghiệp mới tập trung vào việc hỗ trợ các tổ chức triển khai hệ thống AI trên các quy trình vận hành quan trọng
NVIDIA mở rộng hỗ trợ cho tác nhân AI cục bộ Hermes.
0:00 15/5/26
NVIDIA nhấn mạnh sự gia tăng mức độ sử dụng của khung phần mềm Hermes Agent do Nous Research phát triển
Microsoft mở rộng các tính năng an toàn cho tìm kiếm AI của Bing.
0:00 15/5/26
Microsoft đã vạch ra các biện pháp an toàn mới cho Bing khi công nghệ tìm kiếm dựa trên trí tuệ nhân tạo chuyển từ việc chỉ đơn thuần truy xuất thông tin sang việc diễn giải ý định
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
OpenAI ra mắt công ty hỗ trợ triển khai AI.
0:00 15/5/26
OpenAI vừa công bố ra mắt OpenAI Deployment Company, một doanh nghiệp mới tập trung vào việc hỗ trợ các tổ chức triển khai hệ thống AI trên các quy trình vận hành quan trọng
NVIDIA mở rộng hỗ trợ cho tác nhân AI cục bộ Hermes.
0:00 15/5/26
NVIDIA nhấn mạnh sự gia tăng mức độ sử dụng của khung phần mềm Hermes Agent do Nous Research phát triển
Microsoft mở rộng các tính năng an toàn cho tìm kiếm AI của Bing.
0:00 15/5/26
Microsoft đã vạch ra các biện pháp an toàn mới cho Bing khi công nghệ tìm kiếm dựa trên trí tuệ nhân tạo chuyển từ việc chỉ đơn thuần truy xuất thông tin sang việc diễn giải ý định

%20(1).webp)




