Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
.webp)
NVIDIA AIBlueprintがスケーラブルな検索パイプラインを強化
Generatived
25/1/31 5:00
NVIDIA は、スケーラブルでカスタマイズ可能な検索パイプラインの構築を開発者が支援できるように設計された RAG 向け AIBlueprintを発表しました。このブループリントは、大規模な言語モデルを広範な企業データにリンクすることで、コンテキスト認識応答を提供するアプリケーションを作成するための基礎ツールとして機能します。関連情報に基づく実用的な洞察を可能にすることで、意思決定と生産性を向上させることを目的としています。
AIBlueprintは OpenAI API との互換性を誇り、マルチターン会話、マルチコレクション、マルチセッション、多言語検索などの機能をサポートしています。また、最適化されたデータ ストレージ、NVIDIA Inference Manager (NIM) の選択とエンドポイントの構成可能なオプション、および再ランク付け機能も提供します。開発者は、提供されたブループリントをそのまま使用することも、他の NVIDIA ブループリントと統合して、AI 駆動型カスタマー サービス アシスタントなどのより複雑なアプリケーションを作成することもできます。
ブループリントを実装する場合、NIM マイクロサービスをセルフホストする際の最小ハードウェア要件は、5 つの H100 または A100 GPU を搭載したシステムです。ブループリントは、Ubuntu 22.04 OS で動作するように設計されており、 Dockerまたは Kubernetes を使用して展開できます。NVIDIA の NeMo Retriever と Llama 3.1 70B Instruct NIM のほか、LangChain や Milvus データベースなどのサードパーティ ソフトウェアが組み込まれており、NVIDIA cuVS で強化されています。
NVIDIA は信頼できる AI の重要性を強調し、開発者に倫理基準の遵守を奨励しています。同社は、幅広い AI アプリケーションの開発をサポートするポリシーを確立しています。開発者は、業界要件へのコンプライアンスを確保し、潜在的な誤用を軽減するために、モデル チームと連携することが求められています。ブループリントに含まれるモデルは、NVIDIA AI Foundation Models Community License によって管理されています。
最新のニュース
NTT西日本がGX支援で提携
26/7/3 0:00
NTT西日本(大阪府大阪市)とタンソーマンGX(東京都渋谷区)は、自治体と連携した中堅・中小企業向け脱炭素支援を推進するため、業務提携契約を締結したと発表した。
Google Cloudが機密AI強化
26/7/3 0:00
Google Cloud(米カリフォルニア州マウンテンビュー)は、Confidential Computingを活用したAI向けセキュリティ機能を強化すると発表した。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
NTT西日本がGX支援で提携
26/7/3 0:00
NTT西日本(大阪府大阪市)とタンソーマンGX(東京都渋谷区)は、自治体と連携した中堅・中小企業向け脱炭素支援を推進するため、業務提携契約を締結したと発表した。
Google Cloudが機密AI強化
26/7/3 0:00
Google Cloud(米カリフォルニア州マウンテンビュー)は、Confidential Computingを活用したAI向けセキュリティ機能を強化すると発表した。

%20(1).webp)
%20(1).webp)
%20(1).webp)
%20(1).webp)

