top of page
Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
.webp)
NVIDIA、MiniMax M3提供拡大
Generatived
26/6/18 0:00
NVIDIA(米カリフォルニア州サンタクララ)は、長文推論やエージェント型ワークフローに対応するマルチモーダルAIモデル「MiniMax M3」の利用環境を拡充したと発表した。単一モデルでテキストや画像、動画を扱える点が特徴という。
MiniMax M3は総パラメータ数4280億のMoEモデルで、最大100万トークンのコンテキスト長をサポートする。独自のMiniMax Sparse Attentionを採用し、長文処理時の計算負荷を大幅に削減するとしている。
同モデルはNVIDIA Blackwellを含むGPU基盤上で利用でき、TensorRT LLMやSGLang、vLLMなど主要なオープンソース推論エンジンに対応する。長時間のコーディング支援や動画理解、デザイン生成などの用途を想定しているという。
また、NVIDIA NeMo Frameworkによるファインチューニングや強化学習にも対応した。開発者はbuild.nvidia.com経由のAPI利用やHugging Faceからのモデル取得を通じて、検証やアプリケーション開発を開始できるとしている。

