top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA NeMo-Skills が大規模言語モデルを高速化

Generatived

25/11/12 0:00

NVIDIA NeMo-Skillsライブラリは、NVIDIA TensorRT-LLMを管理するためのソリューションとして導入され、複雑な数学問題を解く際の大規模言語モデル(LLM)の効率向上を目指しています。このライブラリは、AI数学オリンピック賞2024の受賞に大きく貢献し、FP8量子化とReDrafter投機的デコードを用いたNVIDIA H100 GPU上でのバッチ推論速度が4倍に向上することを実証しました。

高速で再現性の高い推論パイプラインを構築するためのプロセスは、OpenMathモデルをFP8 TensorRT-LLMエンジン用に準備・量子化し、ReDrafterドラフトモデルを投機的デコード用に学習させ、最適化された推論サーバーを起動することから構成されます。このワークフローはスケーラブルに設計されており、最小限の調整で単一のワークステーションまたはクラスター全体で実行可能です。

ユーザーは、 Hugging FaceモデルをFP8量子化を備えた最適化されたTensorRT-LLMエンジンに変換する手順と、推論をさらに高速化するためのReDrafter技術を統合する手順をガイドされます。Appleが開発したReDrafter手法は、より小さなドラフトモデルを用いてトークンを予測することで、メインのLLMがより迅速にレスポンスを生成できるようにします。

本稿では、BF16、FP8、ReDrafterを使用したFP8など、異なる構成間でパフォーマンスを比較するためのベンチマークの重要性についても強調しています。ベンチマークでは、強化されたTensorRT-LLMエンジンを使用することで、生成時間とサンプルスループットが大幅に向上することが示されています。さらに、このライブラリはセキュアなサンドボックス内でのPythonコード実行をサポートしており、LLMはテキスト生成だけでなく、コードを記述して実行することで問題を解決することもできます。ライブラリに付属するコンパニオンノートブックを実行して、これらの機能とパフォーマンス向上をぜひお試しください。

この記事を共有:

最新のニュース
ユースフル社内検索ボット構築ガイド

ユースフル社内検索ボット構築ガイド

25/11/12 0:00

ユースフル(東京都千代田区)は、Microsoft Copilot Studioを用いた「社内ナレッジ検索ボット」の構築手順を解説したガイドの無料配布を始めた。

LegalOn DX化推進へAI活用講演

LegalOn DX化推進へAI活用講演

25/11/12 0:00

LegalOn Technologies(東京都渋谷区)は、11月11日に開催される「第165回SAJビジネスコミュニティ」にて、同社のAI新規事業セクションリーダー小野寺が講演を行う。

F&M、会計事務所向けGeNNect AIを発表

F&M、会計事務所向けGeNNect AIを発表

25/11/12 0:00

株式会社F&Mは、会計事務所向けにAIツール「F&M One GeNNect」の提供開始を発表しました。

Copyleaks、コンテンツの完全性を保証するAI画像検出を発表

Copyleaks、コンテンツの完全性を保証するAI画像検出を発表

25/11/12 0:00

Copyleaksは、 AIによって生成または改ざんされた画像を識別し、改ざん箇所を特定する画期的なソリューションであるAI画像検出技術を発表しました。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
ユースフル社内検索ボット構築ガイド

ユースフル社内検索ボット構築ガイド

25/11/12 0:00

ユースフル(東京都千代田区)は、Microsoft Copilot Studioを用いた「社内ナレッジ検索ボット」の構築手順を解説したガイドの無料配布を始めた。

LegalOn DX化推進へAI活用講演

LegalOn DX化推進へAI活用講演

25/11/12 0:00

LegalOn Technologies(東京都渋谷区)は、11月11日に開催される「第165回SAJビジネスコミュニティ」にて、同社のAI新規事業セクションリーダー小野寺が講演を行う。

F&M、会計事務所向けGeNNect AIを発表

F&M、会計事務所向けGeNNect AIを発表

25/11/12 0:00

株式会社F&Mは、会計事務所向けにAIツール「F&M One GeNNect」の提供開始を発表しました。

Copyleaks、コンテンツの完全性を保証するAI画像検出を発表

Copyleaks、コンテンツの完全性を保証するAI画像検出を発表

25/11/12 0:00

Copyleaksは、 AIによって生成または改ざんされた画像を識別し、改ざん箇所を特定する画期的なソリューションであるAI画像検出技術を発表しました。

bottom of page