Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

NVIDIA NIM Operator 3.0.0 が Kubernetes AI 管理を強化
Generatived
25/9/12 0:00
NVIDIAは、Kubernetes環境におけるAI推論パイプラインの管理を強化するツール、NIM Operator 3.0.0を発表しました。最新バージョンは、リソースの効率的な利用と既存のKubernetesインフラストラクチャとの互換性に重点を置き、NVIDIA NIMおよびNeMoマイクロサービスの導入を効率化することを目指しています。NIM Operatorは、高度なAIモデルの実行に必要な複雑なソフトウェアコンポーネントの運用を担うクラスター管理者にとって特に有益です。
同社はRed Hatとの協業により、KServeへのNIMデプロイメントの統合を実現しました。これにより、NIMマイクロサービスのスケーラブルなデプロイメントが簡素化されます。Red Hatのエンジニアリングチームはこのオープンソースプロジェクトに貢献し、NIM OperatorがKServeのライフサイクル管理とモデルキャッシュ機能を活用できるようにしました。この協業により、NeMo Guardrailsを通じてKServe推論エンドポイント全体に信頼できるAIが提供され、ユーザーエクスペリエンスが向上することが期待されます。
NVIDIAのお客様とパートナーは、NIM Operatorを活用して、多様なアプリケーションとAIエージェントを効果的に管理してきました。このツールは、チャットボット、エージェント型RAG、仮想創薬などで使用されるAIモデルを含む、幅広いAIモデルをサポートしています。NIM Operator 3.0.0のリリースにより、ユーザーはマルチLLM対応およびマルチノードNIMをより効率的に導入し、動的リソース割り当て(DRA)などの機能を活用してGPU管理を改善できるようになりました。
NIM Operator 3.0.0は、企業におけるAIワークフローの導入を促進するためのNVIDIAの広範な取り組みの一環です。NVIDIA AI Blueprintsと連携し、AIアプリケーションの本番環境への移行を簡素化することを目指しています。このツールは、NGCまたはNVIDIA/k8s-nim-operator GitHubリポジトリから入手でき、企業向けサポートと技術支援リソースも提供されます。
最新のニュース
Microsoft、CISO向けリスク管理提言
26/5/1 0:00
Microsoft(米ワシントン州レドモンド)は、副CISOのRico Mariani氏によるブログで、AI時代におけるサイバー脅威の拡大を背景に、企業向けのリスクレビュー手法を解説したと発表した。
NVIDIA、AI基盤構築指針を拡充
26/5/1 0:00
NVIDIA(米カリフォルニア州サンタクララ)は、企業向けAI基盤の構築を支援する「NVIDIA Enterprise Reference Architectures(Enterprise RAs)」とAIファクトリー構成の詳細を公開した。
OpenAI、Stargate拡張加速
26/5/1 0:00
OpenAI(米カリフォルニア州サンフランシスコ)は、AIインフラ構想「Stargate」において、2029年までに米国内で10GW規模の計算基盤確保を目指す計画を前倒しで進め、直近90日間で3GW超の新容量を追加したと明らかにした。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
Microsoft、CISO向けリスク管理提言
26/5/1 0:00
Microsoft(米ワシントン州レドモンド)は、副CISOのRico Mariani氏によるブログで、AI時代におけるサイバー脅威の拡大を背景に、企業向けのリスクレビュー手法を解説したと発表した。
NVIDIA、AI基盤構築指針を拡充
26/5/1 0:00
NVIDIA(米カリフォルニア州サンタクララ)は、企業向けAI基盤の構築を支援する「NVIDIA Enterprise Reference Architectures(Enterprise RAs)」とAIファクトリー構成の詳細を公開した。
OpenAI、Stargate拡張加速
26/5/1 0:00
OpenAI(米カリフォルニア州サンフランシスコ)は、AIインフラ構想「Stargate」において、2029年までに米国内で10GW規模の計算基盤確保を目指す計画を前倒しで進め、直近90日間で3GW超の新容量を追加したと明らかにした。

%20(1).webp)
%20(1).webp)
%20(1).webp)
%20(1).webp)

