Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
.webp)
NVIDIA Memperluas Opsi Penerapan MiniMax M3
Generatived
18/6/26, 00.00
NVIDIA mengumumkan perluasan dukungan penerapan untuk MiniMax M3, model multimodal campuran para ahli yang dirancang untuk penalaran konteks panjang, alur kerja pengkodean, dan aplikasi pemahaman visual.
Model ini memiliki 428 miliar parameter, mendukung hingga satu juta token konteks, dan memproses teks, gambar, dan video dalam arsitektur terpadu. NVIDIA mengatakan MiniMax Sparse Attention mereka meningkatkan efisiensi untuk beban kerja skala besar.
Pengembang dapat menerapkan MiniMax M3 pada infrastruktur yang dipercepat NVIDIA menggunakan TensorRT LLM, SGLang, vLLM, atau Dynamo. Perusahaan tersebut mengatakan model ini cocok untuk sesi pengkodean yang panjang, analisis video, dan pembuatan konten kreatif.
NVIDIA juga menyoroti dukungan untuk kustomisasi melalui NeMo Framework, yang memungkinkan penyempurnaan dan alur kerja pembelajaran penguatan. Pengembang dapat mengakses model melalui API build.nvidia.com atau mengunduh bobot dari Hugging Face.
Bagikan artikel ini:
Tin tức mới nhất
NVIDIA Memperluas Infrastruktur AI Berdaulat di Seluruh Inggris
11/6/26, 00.00
NVIDIA melaporkan peningkatan momentum pengembangan AI di Inggris Raya selama London Tech Week.
Google Meluncurkan Model Audio Gemma 4 12B
11/6/26, 00.00
Google mengumumkan peluncuran Gemma 4 12B, model AI multimodal yang dirancang untuk berjalan secara lokal di laptop dengan memori minimal 16GB.
NVIDIA Mempercepat Inferensi CLIP dengan TensorRT
11/6/26, 00.00
NVIDIA mengumumkan alur kerja untuk mengkonversi checkpoint CLIP terkuantisasi menjadi engine TensorRT, yang memungkinkan penerapan yang dioptimalkan
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
NVIDIA Memperluas Infrastruktur AI Berdaulat di Seluruh Inggris
11/6/26, 00.00
NVIDIA melaporkan peningkatan momentum pengembangan AI di Inggris Raya selama London Tech Week.
Google Meluncurkan Model Audio Gemma 4 12B
11/6/26, 00.00
Google mengumumkan peluncuran Gemma 4 12B, model AI multimodal yang dirancang untuk berjalan secara lokal di laptop dengan memori minimal 16GB.
NVIDIA Mempercepat Inferensi CLIP dengan TensorRT
11/6/26, 00.00
NVIDIA mengumumkan alur kerja untuk mengkonversi checkpoint CLIP terkuantisasi menjadi engine TensorRT, yang memungkinkan penerapan yang dioptimalkan

%20(1).webp)




