top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA、Llama 4 AI モデルの強化されたパフォーマンスを発表

Generatived

25/4/7 0:00

Llama AI モデルの最新版である Llama 4 Scout と Llama 4 Maverick が発表されました。パフォーマンスが大幅に向上しています。NVIDIA のオープンソース ソフトウェアを搭載したこれらのモデルは、NVIDIA Blackwell B200 GPU で実行した場合、1 秒あたり 40,000 を超える出力トークンを処理できます。現在、NVIDIA NIM を通じてマイクロサービスとしてテストに利用でき、さまざまなアプリケーションでの可能性を垣間見ることができます。

Llama 4 の進歩には、専門家混合アーキテクチャによるネイティブ マルチモーダルおよび多言語機能が含まれます。1,090 億のパラメーターと 16 人の専門家を備えた Llama 4 Scout モデルは、複数ドキュメントの要約や広範なユーザー アクティビティの解析などのタスクの処理に特に適しています。一方、4,000億のパラメータと128人のエキスパートを備えたLlama 4 Maverickモデルは、高性能な画像とテキストの理解に優れています。

両方のモデルは、NVIDIA GPUでの大規模言語モデルの推論パフォーマンスを向上させるように設計されたオープンソースライブラリであるNVIDIA TensorRT-LLM用に微調整されています。この最適化により、Blackwell B200 GPUで驚異的なスループットが実現し、Llama 4 Scoutは1秒あたり40,000トークン以上、Llama 4 Maverickは1秒あたり30,000トークン以上を達成しています。

NVIDIAとMetaのコラボレーションは、オープンモデルの開発を促進し続け、AIの透明性を促進し、幅広いユーザーがAIの安全性と回復力に貢献できるようにします。さらに、NVIDIAのNeMoフレームワークは、エンタープライズデータを使用してLlamaモデルを微調整しやすくし、これらのモデルをAIアプリケーションに適応させるプロセスを合理化します。導入を簡素化するために、NVIDIA NIM は Llama 4 モデルをマイクロサービスとしてパッケージ化し、データのプライバシーとセキュリティを維持しながら GPU アクセラレーション インフラストラクチャへの容易な統合を保証します。

この記事を共有:

最新のニュース
ベクターHDとアデコAIサーバー連携

ベクターHDとアデコAIサーバー連携

25/12/5 0:00

ベクターHD(東京都港区)は、Cornami社(米国テキサス州)のAIサーバーを導入し、アデコ社(東京都千代田区)とデータアノテーション領域で連携を開始した。

ストックラボAI導入で革靴リユース向上

ストックラボAI導入で革靴リユース向上

25/12/5 0:00

ストックラボ(東京都渋谷区)は、革靴買取専門店LASTLABの運営を通じて、AIモジュールを組み込んだリユース基幹SaaS ReCOREの新オペレーションを導入した。

DIVX知立市AI実証実験開始

DIVX知立市AI実証実験開始

25/12/5 0:00

DIVX(東京都港区)は、愛知県知立市と共同で、契約事務の問い合わせ対応効率化を目指す生成AIの実証実験を開始した。

日立ソリューションズ建設AI自動化開始

日立ソリューションズ建設AI自動化開始

25/12/5 0:00

日立ソリューションズ(東京都品川区)は、建設業の技術情報調査や文書作成を自動化する「建設業向けAIエージェント活用ソリューション」を12月4日から提供開始する。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
ベクターHDとアデコAIサーバー連携

ベクターHDとアデコAIサーバー連携

25/12/5 0:00

ベクターHD(東京都港区)は、Cornami社(米国テキサス州)のAIサーバーを導入し、アデコ社(東京都千代田区)とデータアノテーション領域で連携を開始した。

ストックラボAI導入で革靴リユース向上

ストックラボAI導入で革靴リユース向上

25/12/5 0:00

ストックラボ(東京都渋谷区)は、革靴買取専門店LASTLABの運営を通じて、AIモジュールを組み込んだリユース基幹SaaS ReCOREの新オペレーションを導入した。

DIVX知立市AI実証実験開始

DIVX知立市AI実証実験開始

25/12/5 0:00

DIVX(東京都港区)は、愛知県知立市と共同で、契約事務の問い合わせ対応効率化を目指す生成AIの実証実験を開始した。

日立ソリューションズ建設AI自動化開始

日立ソリューションズ建設AI自動化開始

25/12/5 0:00

日立ソリューションズ(東京都品川区)は、建設業の技術情報調査や文書作成を自動化する「建設業向けAIエージェント活用ソリューション」を12月4日から提供開始する。

bottom of page