Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA ra mắt phiên bản MiniMax M2.7 dạng mở.
Generatived
0:00 15/4/26
MiniMax M2.7 được giới thiệu như một bản cập nhật cho mô hình M2.5, nhắm đến các quy trình làm việc dựa trên tác nhân và các nhiệm vụ suy luận phức tạp trong phần mềm và kỹ thuật.
Các tối ưu hóa cho vLLM và SGLang tích hợp các nhân QK RMSNorm và FP8 MoE, cải thiện hiệu suất trên GPU Blackwell Ultra với mức tăng được báo cáo là 2,7 lần.
Các ví dụ triển khai cho vLLM và SGLang sử dụng song song tensor và các cờ hỗ trợ MoE để suy luận hiệu quả trên GPU doanh nghiệp và các thiết bị đầu cuối đám mây.
NVIDIA NeMo Framework và các điểm kiểm tra Hugging Face hỗ trợ tinh chỉnh MiniMax M2.7 với các tùy chọn triển khai mở.
Chia sẻ bài viết này:
Tin tức mới nhất
Vertex AI ra mắt thiết bị đầu cuối đa vùng Claude.
0:00 28/4/26
Google Cloud vừa công bố bản xem trước công khai các điểm cuối đa vùng cho Claude trên Vertex AI.
Mô hình DeepSeek V4 cho phép trí tuệ nhân tạo với hàng triệu token
0:00 27/4/26
DeepSeek vừa giới thiệu hai mẫu sản phẩm chủ lực thế hệ thứ tư của mình, DeepSeek-V4-Pro và DeepSeek-V4-Flash, cả hai đều hỗ trợ cửa sổ ngữ cảnh lên đến 1 triệu token.
GPT-5.5 ra mắt trên Microsoft Foundry for Enterprises
0:00 27/4/26
OpenAI vừa thông báo rằng GPT-5.5 sẽ được phát hành rộng rãi trên Microsoft Foundry của Microsoft, đưa mô hình tiên tiến nhất của họ đến môi trường doanh nghiệp dựa trên Azure.
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
Vertex AI ra mắt thiết bị đầu cuối đa vùng Claude.
0:00 28/4/26
Google Cloud vừa công bố bản xem trước công khai các điểm cuối đa vùng cho Claude trên Vertex AI.
Mô hình DeepSeek V4 cho phép trí tuệ nhân tạo với hàng triệu token
0:00 27/4/26
DeepSeek vừa giới thiệu hai mẫu sản phẩm chủ lực thế hệ thứ tư của mình, DeepSeek-V4-Pro và DeepSeek-V4-Flash, cả hai đều hỗ trợ cửa sổ ngữ cảnh lên đến 1 triệu token.
GPT-5.5 ra mắt trên Microsoft Foundry for Enterprises
0:00 27/4/26
OpenAI vừa thông báo rằng GPT-5.5 sẽ được phát hành rộng rãi trên Microsoft Foundry của Microsoft, đưa mô hình tiên tiến nhất của họ đến môi trường doanh nghiệp dựa trên Azure.






