top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA、AI 展開のための推論サーバーを発表

Generatived

24/11/22 4:30

NVIDIA は、ドメイン固有のデータに合わせて調整された AI モデルの展開を効率化する新しいソリューションを導入しました。NVIDIA 推論サーバー (NIS) は、事前構築された推論マイクロサービスを提供しており、AI 基盤モデルをエンタープライズ アプリケーションに迅速に統合できます。これらのマイクロサービスは、パラメーター効率の良い微調整 (PEFT) などのさまざまな方法で微調整されたモデルをサポートするように設計されており、最適なパフォーマンスを保証します。

同社は、トレーニング中にモデルの重みを直接調整する際に推論ソフトウェアを構成する複雑さを排除するプロセスを開発しました。NVIDIA の NIS は、特定のモデルと GPU 設定に合わせて微調整された TensorRT-LLM 推論エンジンを自動的に構築できるため、展開が 1 つのステップに簡素化されます。

NVIDIA の最新チュートリアルでは、教師あり微調整 (SFT) によってカスタマイズされたモデル用の NIS マイクロサービスの展開を紹介しています。このガイドでは、パフォーマンスが最適化された TensorRT-LLM 推論エンジンをローカルで構築および展開するための詳細な手順と必要なコマンドが提供されています。前提条件には、十分な GPU メモリと特定のソフトウェアのインストールを備えた NVIDIA アクセラレーション コンピューティング環境が含まれます。

同社は、推論エンジンのパフォーマンス プロファイルの選択の容易さを強調しています。このプロファイルは、ユーザーのハードウェアとモデルの選択に自動的に適合します。これらのプロファイルは、アプリケーションのニーズに応じて、レーテンシーまたはスループットを最適化するように設計されています。NVIDIA の取り組みは、AI 推論機能の迅速な導入を促進することを目的としており、開発者フォーラムとドキュメントを通じてリソースとコミュニティ サポートを提供しています。

この記事を共有:

最新のニュース
Qodo、AI駆動型ダイナ�ミックコーディングルールシステムを導入

Qodo、AI駆動型ダイナミックコーディングルールシステムを導入

26/2/19 0:00

Qodoは、ソフトウェア開発におけるAIガバナンスを強化するために設計された革新的なルールシステムを発表しました。

ZETA、Eコマース向けAI統合プラットフォームを発表

ZETA、Eコマース向けAI統合プラットフォームを発表

26/2/19 0:00

ZETAは、AIチャットボットなどの生成型AIサービスを、商品検索エンジンやレビュー・Q&AエンジンといったECサイト機能に容易に統合できる新プラットフォーム「ZETA LINK for AI」の提供開始を発表しました。

AWS IndiaとYottaがNICのクラウドインフラストラクチャを強化

AWS IndiaとYottaがNICのクラウドインフラストラクチャを強化

26/2/19 0:00

Amazon Web Services Indiaは、Yotta Data Servicesと提携し、国立情報学センター(NIC)のMeghraj 2.0プロジェクトにAWS Outpostsを導入しました。

NVIDIA Enterprise RAGBlueprintがインテリジェント エージェントの機能を強化

NVIDIA Enterprise RAGBlueprintがインテリジェント エージェントの機能を強化

26/2/19 0:00

NVIDIA Enterprise RAGBlueprintは、企業データのマルチモーダル理解を提供することでインテリジェントエージェントの能力を強化することを目的とした、新しいモジュール式リファレンスアーキテクチャを導入しました。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
Qodo、AI駆動型ダイナミックコーディングルールシステムを導入

Qodo、AI駆動型ダイナミックコーディングルールシステムを導入

26/2/19 0:00

Qodoは、ソフトウェア開発におけるAIガバナンスを強化するために設計された革新的なルールシステムを発表しました。

ZETA、Eコマース向けAI統合プラットフォームを発表

ZETA、Eコマース向けAI統合プラットフォームを発表

26/2/19 0:00

ZETAは、AIチャットボットなどの生成型AIサービスを、商品検索エンジンやレビュー・Q&AエンジンといったECサイト機能に容易に統合できる新プラットフォーム「ZETA LINK for AI」の提供開始を発表しました。

AWS IndiaとYottaがNICのクラウドインフラストラクチャを強化

AWS IndiaとYottaがNICのクラウドインフラストラクチャを強化

26/2/19 0:00

Amazon Web Services Indiaは、Yotta Data Servicesと提携し、国立情報学センター(NIC)のMeghraj 2.0プロジェクトにAWS Outpostsを導入しました。

NVIDIA Enterprise RAGBlueprintがインテリジェント エージェントの機能を強化

NVIDIA Enterprise RAGBlueprintがインテリジェント エージェントの機能を強化

26/2/19 0:00

NVIDIA Enterprise RAGBlueprintは、企業データのマルチモーダル理解を提供することでインテリジェントエージェントの能力を強化することを目的とした、新しいモジュール式リファレンスアーキテクチャを導入しました。

bottom of page