top of page

Generatived（Beta）｜生成AIの最新ニュースとトレンドを提供

MiniMax M2.7 NVIDIAで公開開始新版β

Generatived

26/4/15 0:00

MiniMax M2.7の公開により、既存のM2.5を拡張したエージェント向けMoEモデルが提供され、NVIDIAおよびオープンソース推論環境で利用可能になったとされる。大規模MoE設計や長文コンテキスト200K対応などの特徴も含むと説明される

vLLMやSGLangへの最適化としてQK RMSNormやFP8 MoEカーネルが統合され、Blackwell Ultra GPU環境でスループット最大2.7倍改善が報告されたとされるMoEルーティング最適化によりレイテンシ削減も確認とのこと

vLLM・SGLangのデプロイ手順ではtensor parallelやMoE対応フラグが提示され、エンタープライズ環境での高速推論実行が容易になる構成とされる。またNVIDIAエンドポイントやNIMマイクロサービスでの展開も想定とされる。

NVIDIA NeMoフレームワークやHugging Face上のチェックポイントを活用し、MiniMax M2.7のファインチューニングやRL学習が可能と案内されたとされるオープンウェイト提供によりエージェント用途拡張も期待とされるとされる。

ソース：NVIDIA Developer Blog

この記事を共有:

最新のニュース

Vertex AI、Claudeのマルチリージョン提供

Vertex AI、Claudeのマルチリージョン提供

26/4/28 0:00

Google Cloudは、Vertex AI上でClaudeのマルチリージョンエンドポイントの公開プレビュー提供を開始した。

続きを読む

DeepSeek V4、100万トークン対応モデル発表

DeepSeek V4、100万トークン対応モデル発表

26/4/27 0:00

DeepSeekは、第4世代となるフラッグシップモデル「DeepSeek-V4-Pro」と「DeepSeek-V4-Flash」を発表した。

続きを読む

GPT-5.5、Microsoft Foundryで提供開始

GPT-5.5、Microsoft Foundryで提供開始

26/4/27 0:00

OpenAIの最新モデル「GPT-5.5」が、MicrosoftのMicrosoft Foundryで一般提供される。

続きを読む

ChatSense、GPT Image 2対応へ

ChatSense、GPT Image 2対応へ

26/4/27 0:00

ナレッジセンスは、法人向けAIエージェントツール「ChatSense」において、OpenAIが発表した最新画像生成モデル「GPT Image 2（ChatGPT Images 2.0）」に今月中に対応予定であると発表した。

続きを読む

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived

カテゴリー

AIイメージエンハンサー

AIコードジェネレーター

AIタスク管理

ノーコード／ローコード

AIグラフィックデザインジェネレーター

AIアート／イラストジェネレーター

全てのツール

ニュース

AIと法律/制度/経済/社会

AI企業/製品/技術

クリエーティブ系生成AI

テキスト系生成AI

日本の生成AI

生成AIの基礎

究極のAIアプリケーションガイド

会社概要

個人情報保護方針

サイト利用規約

フォローをお願いします

言語

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

フォローをお願いします

言語

カテゴリー

全てのツール

AIタスク管理

AIグラフィックデザインジェネレーター

ノーコード／ローコード

AIコードジェネレーター

AIイメージエンハンサー

AIアート／イラストジェネレーター

AIと法律/制度/経済/社会

AI企業/製品/技術

クリエーティブ系生成AI

テキスト系生成AI

日本の生成AI

生成AIの基礎

究極のAIアプリケーションガイド

ニュース

個人情報保護方針

サイト利用規約

会社概要

最新のニュース

Vertex AI、Claudeのマルチリージョン提供

Vertex AI、Claudeのマルチリージョン提供

26/4/28 0:00

Google Cloudは、Vertex AI上でClaudeのマルチリージョンエンドポイントの公開プレビュー提供を開始した。

続きを読む

DeepSeek V4、100万トークン対応モデル発表

DeepSeek V4、100万トークン対応モデル発表

26/4/27 0:00

DeepSeekは、第4世代となるフラッグシップモデル「DeepSeek-V4-Pro」と「DeepSeek-V4-Flash」を発表した。

続きを読む

GPT-5.5、Microsoft Foundryで提供開始

GPT-5.5、Microsoft Foundryで提供開始

26/4/27 0:00

OpenAIの最新モデル「GPT-5.5」が、MicrosoftのMicrosoft Foundryで一般提供される。

続きを読む

ChatSense、GPT Image 2対応へ

ChatSense、GPT Image 2対応へ

26/4/27 0:00

ナレッジセンスは、法人向けAIエージェントツール「ChatSense」において、OpenAIが発表した最新画像生成モデル「GPT Image 2（ChatGPT Images 2.0）」に今月中に対応予定であると発表した。

続きを読む

bottom of page