top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

MiniMax M2.7 NVIDIAで公開開始新版β

Generatived

26/4/15 0:00

MiniMax M2.7の公開により、既存のM2.5を拡張したエージェント向けMoEモデルが提供され、NVIDIAおよびオープンソース推論環境で利用可能になったとされる。大規模MoE設計や長文コンテキスト200K対応などの特徴も含むと説明される

vLLMやSGLangへの最適化としてQK RMSNormやFP8 MoEカーネルが統合され、Blackwell Ultra GPU環境でスループット最大2.7倍改善が報告されたとされるMoEルーティング最適化によりレイテンシ削減も確認とのこと

vLLM・SGLangのデプロイ手順ではtensor parallelやMoE対応フラグが提示され、エンタープライズ環境での高速推論実行が容易になる構成とされる。またNVIDIAエンドポイントやNIMマイクロサービスでの展開も想定とされる。

NVIDIA NeMoフレームワークやHugging Face上のチェックポイントを活用し、MiniMax M2.7のファインチューニングやRL学習が可能と案内されたとされるオープンウェイト提供によりエージェント用途拡張も期待とされるとされる。

この記事を共有:

最新のニュース
Dropbox ChatGPT連携アプリ3種発表

Dropbox ChatGPT連携アプリ3種発表

26/4/21 0:00

Dropbox Japan(東京都千代田区)は、ChatGPTと連携する3つの新アプリを発表したと明らかにした。

ChillStack NEC経費AI連携開始

ChillStack NEC経費AI連携開始

26/4/21 0:00

ChillStack(東京都渋谷区)とNEC(東京都港区)は、不正経費自動検知クラウド「Stena Expense」と行政向け業務システム「GPRIME庶務事務」のデータ連携を開始したと発表した。

NTTデータ先端技術tsuzumi2対応開始

NTTデータ先端技術tsuzumi2対応開始

26/4/21 0:00

NTTデータ先端技術(東京都千代田区)は、Private AIサービス「INTELLILINK Private AI スタートパック」で、NTT開発のLLM「tsuzumi 2」への対応検証を開始したと発表した。

リチカ 動画自動生成機能を追加発表

リチカ 動画自動生成機能を追加発表

26/4/21 0:00

リチカ(東京都渋谷区)は、LP情報や画像素材をもとに複数の広告動画を一括生成できる機能を「リチカ クラウド」に追加したと発表した。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
Dropbox ChatGPT連携アプリ3種発表

Dropbox ChatGPT連携アプリ3種発表

26/4/21 0:00

Dropbox Japan(東京都千代田区)は、ChatGPTと連携する3つの新アプリを発表したと明らかにした。

ChillStack NEC経費AI連携開始

ChillStack NEC経費AI連携開始

26/4/21 0:00

ChillStack(東京都渋谷区)とNEC(東京都港区)は、不正経費自動検知クラウド「Stena Expense」と行政向け業務システム「GPRIME庶務事務」のデータ連携を開始したと発表した。

NTTデータ先端技術tsuzumi2対応開始

NTTデータ先端技術tsuzumi2対応開始

26/4/21 0:00

NTTデータ先端技術(東京都千代田区)は、Private AIサービス「INTELLILINK Private AI スタートパック」で、NTT開発のLLM「tsuzumi 2」への対応検証を開始したと発表した。

リチカ 動画自動生成機能を追加発表

リチカ 動画自動生成機能を追加発表

26/4/21 0:00

リチカ(東京都渋谷区)は、LP情報や画像素材をもとに複数の広告動画を一括生成できる機能を「リチカ クラウド」に追加したと発表した。

bottom of page