top of page
Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
logo.png

NVIDIA TensorRT がディープラーニング推論のパフォーマンスを向上

Generatived

2024年5月16日

NVIDIA は、ランタイムとモデルの最適化を改善してディープラーニング推論を強化するように設計されたAPIエコシステムの最新版である NVIDIA TensorRT を発表しました。新しいリリースでは、インストールが簡素化され、使いやすさが向上し、より幅広い AI モデルがサポートされ、実稼働アプリケーションで効率的な低レイテンシと高スループットのパフォーマンスが保証されます。

開発者は、更新された Debian および RPM メタパッケージにより、`apt-get install tensorrt` や `pip install tensorrt` などのコマンドを使用してセットアップが簡単になり、TensorRT 10.0 のより合理化されたエクスペリエンスの恩恵を受けることができるようになりました。このリリースでは、Debug Tensors APIも導入されています。これは、テンソルの値が書き込まれるたびに、テンソルの詳細を含むコールバック関数を呼び出すことで、グラフ内の問題を正確に特定するのに役立ちます。ONNX パーサーのエラー レポートの強化や、バージョンとハードウェアの互換性を含む Windows 開発の大幅なアップグレードも、この更新の一部です。

TensorRT 10.0 のパフォーマンス強化の目玉は、ブロック量子化による INT4 重みのみの量子化 (WoQ) です。これにより、メモリが限られた GPU でもメモリを効率的に使用できます。新しいバージョンでは、最大 99% の圧縮を実現できる重みを取り除いたエンジンもサポートされており、再構築することなく実行時にエンジンに重みを再調整できます。さらに、実行時の割り当て戦略を指定できるようになり、重みストリーミング機能により、GPU メモリ容量を超える大規模なモデルを実行できます。

これらの機能を補完するために、NVIDIA は TensorRT Model Optimizer 0.11 もリリースしました。これは、量子化、スパース性、蒸留などのトレーニング後およびトレーニングインザループのモデル最適化を提供するライブラリです。このツールは、複雑さを軽減し、推論速度を向上させることで、ディープラーニング モデルの展開を簡素化することを目的としています。Model Optimizer はさまざまなトレーニング フレームワークと統合されているため、開発者はさまざまな環境で NVIDIA のプラットフォームを利用できます。さらに、Nsight Deep Learning Designer 2024.1 の導入により、DNN を最適化するための統合開発環境が提供され、最適なパフォーマンスを得るためにモデルを微調整するための視覚的なツールが提供されます。ソース:

この記事を共有:

最新のニュース
ノボAI香港フィンテック週間出展

ノボAI香港フィンテック週間出展

2024年10月23日 4:30:20

ノボAI(シンガポール)は、2024年香港フィンテック週間の注目ゲストとして招待された。

LTIマインドツリーAIアンダーライト支援

LTIマインドツリーAIアンダーライト支援

2024年10月23日 4:30:20

LTIマインドツリー(ムンバイ)はServiceNowと共同で「AI-Smart Underwriter」ソリューションを開発したと発表。

VVDN、Google Gen AIで新ソリューション

VVDN、Google Gen AIで新ソリューション

2024年10月23日 4:30:20

VVDN Technologies(インド、グルグラム)は、GoogleのGen AIモデル「Gemini Pro」を社内のワークフォースとIP製品に統合したと発表。

Agentech、300万ドルのシードラウンド資金調達成功を発表

Agentech、300万ドルのシードラウンド資金調達成功を発表

2024年10月23日 4:30:20

保険金請求のためのグローバル AI サポート ワークフォースである Agentech は最近、わずか 30 日間で 300 万ドルのシード ファンディング ラウンドを完了したことを発表しました。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

最新のニュース
ノボAI香港フィンテック週間出展

ノボAI香港フィンテック週間出展

2024年10月23日 4:30:20

ノボAI(シンガポール)は、2024年香港フィンテック週間の注目ゲストとして招待された。

LTIマインドツリーAIアンダーライト支援

LTIマインドツリーAIアンダーライト支援

2024年10月23日 4:30:20

LTIマインドツリー(ムンバイ)はServiceNowと共同で「AI-Smart Underwriter」ソリューションを開発したと発表。

VVDN、Google Gen AIで新ソリューション

VVDN、Google Gen AIで新ソリューション

2024年10月23日 4:30:20

VVDN Technologies(インド、グルグラム)は、GoogleのGen AIモデル「Gemini Pro」を社内のワークフォースとIP製品に統合したと発表。

Agentech、300万ドルのシードラウンド資金調達成功を発表

Agentech、300万ドルのシードラウンド資金調達成功を発表

2024年10月23日 4:30:20

保険金請求のためのグローバル AI サポート ワークフォースである Agentech は最近、わずか 30 日間で 300 万ドルのシード ファンディング ラウンドを完了したことを発表しました。

bottom of page