top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA と Mistral AI が Mistral-NeMo-Minitron 8B をリリース

Generatived

24/8/23 9:00

NVIDIA と Mistral AI は最近、さまざまなベンチマークでパフォーマンスの新たな基準を確立した大規模言語モデル (LLM) である Mistral NeMo 12B を発表しました。この成功を基に、両社は、9 つの主要なベンチマークでクラス最高の精度を誇る高度なオープン アクセス モデルである Mistral-NeMo-Minitron 8B のリリースを発表しました。Mistral-NeMo-Minitron 8B の開発には、より大きな Mistral NeMo 12B の幅プルーニングと呼ばれる手法が使用され、その後、知識蒸留を使用した再トレーニング プロセスが行われました。この方法は、NVIDIA Minitron 8B および 4B、Llama-3.1-Minitron 4B などの以前のモデルで検証されています。

モデルのプルーニングと蒸留のプロセスでは、モデルのサイズを縮小して、予測機能を大幅に損なうことなく、モデルをより効率的にします。 Mistral-NeMo-Minitron 8B モデルは、元のモデルの幅を選択的に削減し、その後、軽い再トレーニング レジメンを適用することで作成されました。このアプローチは効果的かつコスト効率が高いことが実証されており、最初からトレーニングしたモデルと比較して、高品質を維持する小規模なモデルの作成を可能にします。

LLM の競争環境において、Mistral-NeMo-Minitron 8B は、その優れたパフォーマンス メトリックによって際立っています。このモデルの精度は比較表で強調されており、Gemma 7B や Llama-3.1 8B など、同様のサイズの他のモデルよりも一貫して優れています。この表は、さまざまなベンチマークでモデルの優れたパフォーマンスを示しており、太字の数字は 8B モデル クラスの中で最高のスコアを示しています。

Mistral-NeMo-Minitron 8B のリリースは、言語モデルの進化における重要な一歩です。これは、構造化された重みの削減と知識の蒸留を組み合わせた有効性を示すだけでなく、この分野の将来の進歩の土台を築くものでもあります。このモデルの開発に使用された技術は、生成 AI 用の NVIDIA NeMo フレームワークに統合され、言語処理技術の機能がさらに強化されることが期待されています。ソース:

この記事を共有:

最新のニュース
LANY AI時代の広報戦略セミナー開催

LANY AI時代の広報戦略セミナー開催

26/2/17 0:00

LANY(東京都渋谷区)は、2026年2月20日に「AIに選ばれ、メディアの変化を生き抜くPRとは」と題したセミナーに登壇する。

ストックマークEVセミナー次世代半導体焦点

ストックマークEVセミナー次世代半導体焦点

26/2/17 0:00

ストックマーク(東京都港区)は、2月19日に「EV進化を加速するパワーエレクトロニクスの最前線 〜次世代半導体が切り拓く高効率・高性能化〜」と題したオンラインセミナーを開催する。

Librex AIお悩み相談会スタート

Librex AIお悩み相談会スタート

26/2/17 0:00

Librex(東京都渋谷区)は、AIコミュニティ「b-Crew」で「AIお悩み相談会」を開始する。

VOLTMIND協力 関電AIハッカソン開催

VOLTMIND協力 関電AIハッカソン開催

26/2/17 0:00

VOLTMIND(大阪市)は、関西電力が主催する「関西電力KOI×VOLTMIND 生成AIハッカソン」に協力パートナーとして参加する。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
LANY AI時代の広報戦略セミナー開催

LANY AI時代の広報戦略セミナー開催

26/2/17 0:00

LANY(東京都渋谷区)は、2026年2月20日に「AIに選ばれ、メディアの変化を生き抜くPRとは」と題したセミナーに登壇する。

ストックマークEVセミナー次世代半導体焦点

ストックマークEVセミナー次世代半導体焦点

26/2/17 0:00

ストックマーク(東京都港区)は、2月19日に「EV進化を加速するパワーエレクトロニクスの最前線 〜次世代半導体が切り拓く高効率・高性能化〜」と題したオンラインセミナーを開催する。

Librex AIお悩み相談会スタート

Librex AIお悩み相談会スタート

26/2/17 0:00

Librex(東京都渋谷区)は、AIコミュニティ「b-Crew」で「AIお悩み相談会」を開始する。

VOLTMIND協力 関電AIハッカソン開催

VOLTMIND協力 関電AIハッカソン開催

26/2/17 0:00

VOLTMIND(大阪市)は、関西電力が主催する「関西電力KOI×VOLTMIND 生成AIハッカソン」に協力パートナーとして参加する。

bottom of page