top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA Jetson Thor プラットフォームが生成AIのパフォーマンスを向上

Generatived

25/10/17 0:00

NVIDIAは、Jetson AGX Thorプラットフォームの大幅なパフォーマンス強化を発表しました。これにより、生成AIスループットは発売以来最大7倍に向上しました。NVIDIAのソフトウェア最適化への取り組みがこれらの改善につながり、LlamaやDeepSeekなどのモデルを扱う開発者にとってメリットとなります。NVIDIAは新しいAIモデルのサポートをリリース後数日以内に提供することが多く、開発者は最新の技術をプロジェクトに迅速に統合できます。

Jetson Thorプラットフォームは、NVIDIA Blackwell GPUアーキテクチャのNVFP4など、主要な量子化フォーマットのサポートも統合しています。この追加機能と投機的デコードなどの技術を組み合わせることで、特にエッジコンピューティングアプリケーションにおけるAI推論をさらに最適化します。最近リリースされたvLLMコンテナは、既存モデルと比較して最大3.5倍のパフォーマンス向上を実証しており、NVIDIAのソフトウェアエコシステムの強化への取り組みを示しています。

NVIDIAのJetson Thorプラットフォームは、vLLMコンテナでEagle 3の投機的デコードをサポートするようになり、生成AIモデルの速度が大幅に向上しました。例えば、Llama 3.3 70B モデルは投機的デコード機能を備えており、1秒あたり88.62トークンの出力を実現しています。これは、リリース当初の数値から大幅なパフォーマンス向上を示しています。これは、エッジにおける AI ワークロードを高速化するための強力なツールを開発者に提供することに NVIDIA が注力していることを示しています。

開発者は、Jetson Thor プラットフォーム上で最新の生成 AI モデルの Day 0 サポートを利用できるため、最先端テクノロジにすぐにアクセスできます。NVIDIA の量子化と投機的デコードへのアプローチは、プラットフォーム上で生成 AI のパフォーマンスを最大化するためのガイドとなります。毎月更新されるスタンドアロンの vLLM コンテナのリリースにより、NVIDIA は開発者が AI モデルの最適化とベンチマークを行うプロセスを簡素化し、エッジにおける AI テクノロジの進化における同社の役割を強化しています。

この記事を共有:

最新のニュース
ジンベイ岩崎学園OCR実証実験開始

ジンベイ岩崎学園OCR実証実験開始

25/12/10 0:00

ジンベイ(神奈川県横浜市)は岩崎学園と共同で、紙帳票のデータ化を目的としたOCR実証実験を開始。

GoogleがAIクエストを開始、500万ドルを寄付

GoogleがAIクエストを開始、500万ドルを寄付

25/12/10 0:00

Googleは、コーディングと計算論的思考をより身近なものにすることを目的とした取り組みであるコンピュータサイエンス教育週間(CSEdWeek)を長年支援してきました。

NVIDIA、LLMパフォーマンス強化のためのNVFP4を発表

NVIDIA、LLMパフォーマンス強化のためのNVFP4を発表

25/12/10 0:00

NVIDIA Blackwell GPUにおける大規模言語モデル(LLM)のパフォーマンスを向上させるため、新しいKVフォーマットであるNVFP4が導入されました。

ヴァージン・アトランティック、AI統合でOpenAIと提携

ヴァージン・アトランティック、AI統合でOpenAIと提携

25/12/10 0:00

ヴァージン・アトランティック航空の最高財務責任者(CFO)であるオリバー・バイヤーズ氏は、同社のAI投資に対する戦略的アプローチについて洞察を共有し、業界におけるチャレンジャーという同社の理念に合致する技術を採用することの重要性を強調しました。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
ジンベイ岩崎学園OCR実証実験開始

ジンベイ岩崎学園OCR実証実験開始

25/12/10 0:00

ジンベイ(神奈川県横浜市)は岩崎学園と共同で、紙帳票のデータ化を目的としたOCR実証実験を開始。

GoogleがAIクエストを開始、500万ドルを寄付

GoogleがAIクエストを開始、500万ドルを寄付

25/12/10 0:00

Googleは、コーディングと計算論的思考をより身近なものにすることを目的とした取り組みであるコンピュータサイエンス教育週間(CSEdWeek)を長年支援してきました。

NVIDIA、LLMパフォーマンス強化のためのNVFP4を発表

NVIDIA、LLMパフォーマンス強化のためのNVFP4を発表

25/12/10 0:00

NVIDIA Blackwell GPUにおける大規模言語モデル(LLM)のパフォーマンスを向上させるため、新しいKVフォーマットであるNVFP4が導入されました。

ヴァージン・アトランティック、AI統合でOpenAIと提携

ヴァージン・アトランティック、AI統合でOpenAIと提携

25/12/10 0:00

ヴァージン・アトランティック航空の最高財務責任者(CFO)であるオリバー・バイヤーズ氏は、同社のAI投資に対する戦略的アプローチについて洞察を共有し、業界におけるチャレンジャーという同社の理念に合致する技術を採用することの重要性を強調しました。

bottom of page