Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
.webp)
NVIDIA Memperluas Opsi Penerapan MiniMax M3
Generatived
18/6/26, 00.00
NVIDIA mengumumkan perluasan dukungan penerapan untuk MiniMax M3, model multimodal campuran para ahli yang dirancang untuk penalaran konteks panjang, alur kerja pengkodean, dan aplikasi pemahaman visual.
Model ini memiliki 428 miliar parameter, mendukung hingga satu juta token konteks, dan memproses teks, gambar, dan video dalam arsitektur terpadu. NVIDIA mengatakan MiniMax Sparse Attention mereka meningkatkan efisiensi untuk beban kerja skala besar.
Pengembang dapat menerapkan MiniMax M3 pada infrastruktur yang dipercepat NVIDIA menggunakan TensorRT LLM, SGLang, vLLM, atau Dynamo. Perusahaan tersebut mengatakan model ini cocok untuk sesi pengkodean yang panjang, analisis video, dan pembuatan konten kreatif.
NVIDIA juga menyoroti dukungan untuk kustomisasi melalui NeMo Framework, yang memungkinkan penyempurnaan dan alur kerja pembelajaran penguatan. Pengembang dapat mengakses model melalui API build.nvidia.com atau mengunduh bobot dari Hugging Face.
Bagikan artikel ini:
Tin tức mới nhất
Meta Memperluas Infrastruktur Komputasi untuk AI Future
19/6/26, 00.00
Meta menguraikan pentingnya infrastruktur komputasi yang semakin meningkat seiring dengan semakin canggihnya layanan AI dan semakin terintegrasinya layanan tersebut ke
NVIDIA Mempercepat Difusi Gemma di Seluruh Platform RTX
19/6/26, 00.00
NVIDIA mengumumkan optimasi untuk model eksperimental DiffusionGemma dari Google DeepMind, yang memungkinkan penerapan lebih cepat di seluruh GPU RTX, sistem RTX PRO,
NVIDIA Memperluas Penerapan AI Perusahaan DiffusionGemma
18/6/26, 00.00
NVIDIA mengumumkan perluasan dukungan untuk DiffusionGemma, model pembangkitan teks dari Google DeepMind yang dioptimalkan untuk inferensi berkecepatan tinggi
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Meta Memperluas Infrastruktur Komputasi untuk AI Future
19/6/26, 00.00
Meta menguraikan pentingnya infrastruktur komputasi yang semakin meningkat seiring dengan semakin canggihnya layanan AI dan semakin terintegrasinya layanan tersebut ke
NVIDIA Mempercepat Difusi Gemma di Seluruh Platform RTX
19/6/26, 00.00
NVIDIA mengumumkan optimasi untuk model eksperimental DiffusionGemma dari Google DeepMind, yang memungkinkan penerapan lebih cepat di seluruh GPU RTX, sistem RTX PRO,
NVIDIA Memperluas Penerapan AI Perusahaan DiffusionGemma
18/6/26, 00.00
NVIDIA mengumumkan perluasan dukungan untuk DiffusionGemma, model pembangkitan teks dari Google DeepMind yang dioptimalkan untuk inferensi berkecepatan tinggi


%20(1).webp)

.webp)

