Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

MiniMax M2.7 NVIDIAで公開開始新版β
Generatived
26/4/15 0:00
MiniMax M2.7の公開により、既存のM2.5を拡張したエージェント向けMoEモデルが提供され、NVIDIAおよびオープンソース推論環境で利用可能になったとされる。大規模MoE設計や長文コンテキスト200K対応などの特徴も含むと説明される
vLLMやSGLangへの最適化としてQK RMSNormやFP8 MoEカーネルが統合され、Blackwell Ultra GPU環境でスループット最大2.7倍改善が報告されたとされるMoEルーティング最適化によりレイテンシ削減も確認とのこと
vLLM・SGLangのデプロイ手順ではtensor parallelやMoE対応フラグが提示され、エンタープライズ環境での高速推論実行が容易になる構成とされる。またNVIDIAエンドポイントやNIMマイクロサービスでの展開も想定とされる。
NVIDIA NeMoフレームワークやHugging Face上のチェックポイントを活用し、MiniMax M2.7のファインチューニングやRL学習が可能と案内されたとされるオープンウェイト提供によりエージェント用途拡張も期待とされるとされる。
最新のニュース
橋梁診断AIをNTTら共同開発
26/4/28 0:00
NTTドコモソリューションズ株式会社、株式会社NTTドコモ、株式会社溝田設計事務所の3社は、長崎大学の監修のもと、橋梁診断支援サービス「橋梁アセスタ™」を共同開発した。
NVIDIAとOpenAI、AIエージェント活用加速
26/4/28 0:00
NVIDIAは、OpenAIの最新モデル「GPT-5.5」を搭載したエージェント型開発アプリ「Codex」により、社内でのAI活用を大幅に拡大していると発表した。
Swiggy、AI開発者向け新プログラム発表
26/4/28 0:00
Swiggyは、AIネイティブなコマース体験の構築を支援する開発者向けプログラム「Swiggy Builders Club」を発表した。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
橋梁診断AIをNTTら共同開発
26/4/28 0:00
NTTドコモソリューションズ株式会社、株式会社NTTドコモ、株式会社溝田設計事務所の3社は、長崎大学の監修のもと、橋梁診断支援サービス「橋梁アセスタ™」を共同開発した。
NVIDIAとOpenAI、AIエージェント活用加速
26/4/28 0:00
NVIDIAは、OpenAIの最新モデル「GPT-5.5」を搭載したエージェント型開発アプリ「Codex」により、社内でのAI活用を大幅に拡大していると発表した。
Swiggy、AI開発者向け新プログラム発表
26/4/28 0:00
Swiggyは、AIネイティブなコマース体験の構築を支援する開発者向けプログラム「Swiggy Builders Club」を発表した。

%20(1).webp)


%20(1).webp)

