Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA ra mắt phiên bản MiniMax M2.7 dạng mở.
Generatived
0:00 15/4/26
MiniMax M2.7 được giới thiệu như một bản cập nhật cho mô hình M2.5, nhắm đến các quy trình làm việc dựa trên tác nhân và các nhiệm vụ suy luận phức tạp trong phần mềm và kỹ thuật.
Các tối ưu hóa cho vLLM và SGLang tích hợp các nhân QK RMSNorm và FP8 MoE, cải thiện hiệu suất trên GPU Blackwell Ultra với mức tăng được báo cáo là 2,7 lần.
Các ví dụ triển khai cho vLLM và SGLang sử dụng song song tensor và các cờ hỗ trợ MoE để suy luận hiệu quả trên GPU doanh nghiệp và các thiết bị đầu cuối đám mây.
NVIDIA NeMo Framework và các điểm kiểm tra Hugging Face hỗ trợ tinh chỉnh MiniMax M2.7 với các tùy chọn triển khai mở.
Chia sẻ bài viết này:
Tin tức mới nhất
OpenAI ra mắt ChatGPT cho các bác sĩ lâm sàng, cung cấp quyền truy cập miễn phí.
0:00 24/4/26
Theo các báo cáo, OpenAI đã ra mắt ChatGPT dành cho các bác sĩ lâm sàng, cung cấp quyền truy cập miễn phí vào các chuyên gia chăm sóc sức khỏe đã được xác minh tại
Salary Up Lab ra mắt giải pháp đánh giá nhân sự bằng AI.
0:00 24/4/26
Salary Up Lab vừa công bố ra mắt dịch vụ đánh giá nhân sự dựa trên trí tuệ nhân tạo, được thiết kế để hỗ trợ các công ty từ khâu thiết kế hệ thống đến vận hành và cải tiến liên tục.
Hệ thống Heptagon AI Minutes giúp giảm thời gian làm việc.
0:00 24/4/26
Theo các nguồn tin, Heptagon đã hỗ trợ một đài truyền hình khu vực triển khai hệ thống trí tuệ nhân tạo tạo sinh để ghi chép biên bản cuộc họp


%20(1).webp)

