Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

NVIDIA、Llama 4 AI モデルの強化されたパフォーマンスを発表
Generatived
25/4/7 0:00
Llama AI モデルの最新版である Llama 4 Scout と Llama 4 Maverick が発表されました。パフォーマンスが大幅に向上しています。NVIDIA のオープンソース ソフトウェアを搭載したこれらのモデルは、NVIDIA Blackwell B200 GPU で実行した場合、1 秒あたり 40,000 を超える出力トークンを処理できます。現在、NVIDIA NIM を通じてマイクロサービスとしてテストに利用でき、さまざまなアプリケーションでの可能性を垣間見ることができます。
Llama 4 の進歩には、専門家混合アーキテクチャによるネイティブ マルチモーダルおよび多言語機能が含まれます。1,090 億のパラメーターと 16 人の専門家を備えた Llama 4 Scout モデルは、複数ドキュメントの要約や広範なユーザー アクティビティの解析などのタスクの処理に特に適しています。一方、4,000億のパラメータと128人のエキスパートを備えたLlama 4 Maverickモデルは、高性能な画像とテキストの理解に優れています。
両方のモデルは、NVIDIA GPUでの大規模言語モデルの推論パフォーマンスを向上させるように設計されたオープンソースライブラリであるNVIDIA TensorRT-LLM用に微調整されています。この最適化により、Blackwell B200 GPUで驚異的なスループットが実現し、Llama 4 Scoutは1秒あたり40,000トークン以上、Llama 4 Maverickは1秒あたり30,000トークン以上を達成しています。
NVIDIAとMetaのコラボレーションは、オープンモデルの開発を促進し続け、AIの透明性を促進し、幅広いユーザーがAIの安全性と回復力に貢献できるようにします。さらに、NVIDIAのNeMoフレームワークは、エンタープライズデータを使用してLlamaモデルを微調整しやすくし、これらのモデルをAIアプリケーションに適応させるプロセスを合理化します。導入を簡素化するために、NVIDIA NIM は Llama 4 モデルをマイクロサービスとしてパッケージ化し、データのプライバシーとセキュリティを維持しながら GPU アクセラレーション インフラストラクチャへの容易な統合を保証します。
最新のニュース
Microsoft、CISO向けリスク管理提言
26/5/1 0:00
Microsoft(米ワシントン州レドモンド)は、副CISOのRico Mariani氏によるブログで、AI時代におけるサイバー脅威の拡大を背景に、企業向けのリスクレビュー手法を解説したと発表した。
NVIDIA、AI基盤構築指針を拡充
26/5/1 0:00
NVIDIA(米カリフォルニア州サンタクララ)は、企業向けAI基盤の構築を支援する「NVIDIA Enterprise Reference Architectures(Enterprise RAs)」とAIファクトリー構成の詳細を公開した。
OpenAI、Stargate拡張加速
26/5/1 0:00
OpenAI(米カリフォルニア州サンフランシスコ)は、AIインフラ構想「Stargate」において、2029年までに米国内で10GW規模の計算基盤確保を目指す計画を前倒しで進め、直近90日間で3GW超の新容量を追加したと明らかにした。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
Microsoft、CISO向けリスク管理提言
26/5/1 0:00
Microsoft(米ワシントン州レドモンド)は、副CISOのRico Mariani氏によるブログで、AI時代におけるサイバー脅威の拡大を背景に、企業向けのリスクレビュー手法を解説したと発表した。
NVIDIA、AI基盤構築指針を拡充
26/5/1 0:00
NVIDIA(米カリフォルニア州サンタクララ)は、企業向けAI基盤の構築を支援する「NVIDIA Enterprise Reference Architectures(Enterprise RAs)」とAIファクトリー構成の詳細を公開した。
OpenAI、Stargate拡張加速
26/5/1 0:00
OpenAI(米カリフォルニア州サンフランシスコ)は、AIインフラ構想「Stargate」において、2029年までに米国内で10GW規模の計算基盤確保を目指す計画を前倒しで進め、直近90日間で3GW超の新容量を追加したと明らかにした。

%20(1).webp)
%20(1).webp)
%20(1).webp)
%20(1).webp)

