top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA、Llama 4 AI モデルの強化されたパフォーマンスを発表

Generatived

25/4/7 0:00

Llama AI モデルの最新版である Llama 4 Scout と Llama 4 Maverick が発表されました。パフォーマンスが大幅に向上しています。NVIDIA のオープンソース ソフトウェアを搭載したこれらのモデルは、NVIDIA Blackwell B200 GPU で実行した場合、1 秒あたり 40,000 を超える出力トークンを処理できます。現在、NVIDIA NIM を通じてマイクロサービスとしてテストに利用でき、さまざまなアプリケーションでの可能性を垣間見ることができます。

Llama 4 の進歩には、専門家混合アーキテクチャによるネイティブ マルチモーダルおよび多言語機能が含まれます。1,090 億のパラメーターと 16 人の専門家を備えた Llama 4 Scout モデルは、複数ドキュメントの要約や広範なユーザー アクティビティの解析などのタスクの処理に特に適しています。一方、4,000億のパラメータと128人のエキスパートを備えたLlama 4 Maverickモデルは、高性能な画像とテキストの理解に優れています。

両方のモデルは、NVIDIA GPUでの大規模言語モデルの推論パフォーマンスを向上させるように設計されたオープンソースライブラリであるNVIDIA TensorRT-LLM用に微調整されています。この最適化により、Blackwell B200 GPUで驚異的なスループットが実現し、Llama 4 Scoutは1秒あたり40,000トークン以上、Llama 4 Maverickは1秒あたり30,000トークン以上を達成しています。

NVIDIAとMetaのコラボレーションは、オープンモデルの開発を促進し続け、AIの透明性を促進し、幅広いユーザーがAIの安全性と回復力に貢献できるようにします。さらに、NVIDIAのNeMoフレームワークは、エンタープライズデータを使用してLlamaモデルを微調整しやすくし、これらのモデルをAIアプリケーションに適応させるプロセスを合理化します。導入を簡素化するために、NVIDIA NIM は Llama 4 モデルをマイクロサービスとしてパッケージ化し、データのプライバシーとセキュリティを維持しながら GPU アクセラレーション インフラストラクチャへの容易な統合を保証します。

この記事を共有:

最新のニュース
Microsoft、CISO向けリスク管理提言

Microsoft、CISO向けリスク管理提言

26/5/1 0:00

Microsoft(米ワシントン州レドモンド)は、副CISOのRico Mariani氏によるブログで、AI時代におけるサイバー脅威の拡大を背景に、企業向けのリスクレビュー手法を解説したと発表した。

NVIDIA、AI基盤構築指針を拡充

NVIDIA、AI基盤構築指針を拡充

26/5/1 0:00

NVIDIA(米カリフォルニア州サンタクララ)は、企業向けAI基盤の構築を支援する「NVIDIA Enterprise Reference Architectures(Enterprise RAs)」とAIファクトリー構成の詳細を公開した。

OpenAI、Stargate拡張加速

OpenAI、Stargate拡張加速

26/5/1 0:00

OpenAI(米カリフォルニア州サンフランシスコ)は、AIインフラ構想「Stargate」において、2029年までに米国内で10GW規模の計算基盤確保を目指す計画を前倒しで進め、直近90日間で3GW超の新容量を追加したと明らかにした。

ソースネクスト AutoMemo強化

ソースネクスト AutoMemo強化

26/5/1 0:00

ソースネクスト(東京都千代田区)は、AI議事録サービス「AutoMemo」のクラウド連携機能を4月30日に刷新したと発表した。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
Microsoft、CISO向けリスク管理提言

Microsoft、CISO向けリスク管理提言

26/5/1 0:00

Microsoft(米ワシントン州レドモンド)は、副CISOのRico Mariani氏によるブログで、AI時代におけるサイバー脅威の拡大を背景に、企業向けのリスクレビュー手法を解説したと発表した。

NVIDIA、AI基盤構築指針を拡充

NVIDIA、AI基盤構築指針を拡充

26/5/1 0:00

NVIDIA(米カリフォルニア州サンタクララ)は、企業向けAI基盤の構築を支援する「NVIDIA Enterprise Reference Architectures(Enterprise RAs)」とAIファクトリー構成の詳細を公開した。

OpenAI、Stargate拡張加速

OpenAI、Stargate拡張加速

26/5/1 0:00

OpenAI(米カリフォルニア州サンフランシスコ)は、AIインフラ構想「Stargate」において、2029年までに米国内で10GW規模の計算基盤確保を目指す計画を前倒しで進め、直近90日間で3GW超の新容量を追加したと明らかにした。

ソースネクスト AutoMemo強化

ソースネクスト AutoMemo強化

26/5/1 0:00

ソースネクスト(東京都千代田区)は、AI議事録サービス「AutoMemo」のクラウド連携機能を4月30日に刷新したと発表した。

bottom of page