top of page
Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA ra mắt phiên bản MiniMax M2.7 dạng mở.
Generatived
0:00 15/4/26
MiniMax M2.7 được giới thiệu như một bản cập nhật cho mô hình M2.5, nhắm đến các quy trình làm việc dựa trên tác nhân và các nhiệm vụ suy luận phức tạp trong phần mềm và kỹ thuật.
Các tối ưu hóa cho vLLM và SGLang tích hợp các nhân QK RMSNorm và FP8 MoE, cải thiện hiệu suất trên GPU Blackwell Ultra với mức tăng được báo cáo là 2,7 lần.
Các ví dụ triển khai cho vLLM và SGLang sử dụng song song tensor và các cờ hỗ trợ MoE để suy luận hiệu quả trên GPU doanh nghiệp và các thiết bị đầu cuối đám mây.
NVIDIA NeMo Framework và các điểm kiểm tra Hugging Face hỗ trợ tinh chỉnh MiniMax M2.7 với các tùy chọn triển khai mở.
Chia sẻ bài viết này:

%20(1).webp)