Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

LG AIリサーチ、新たなAI管理プラットフォームを発表
Generatived
25/7/28 0:00
Cluster Directorは、大規模AIインフラストラクチャの導入と管理を簡素化することを目的とした新しい管理プレーンを導入しました。このプラットフォームは、直感的なインターフェース、マネージドSlurmエクスペリエンス、そしてAIスーパーコンピューティングタスクの効率性を高めるために設計された可観測性ダッシュボードを提供します。
AIおよびHPCクラスターの構築は、コンピューティング、ネットワーク、ストレージにわたる複雑な構成を伴うことが多く、その課題はCluster Directorの統合インターフェースによって解決されます。このインターフェースはプロセスを合理化し、最適化されたリソースを統合された管理しやすい環境に統合します。LG AI Researchは、クラスターの展開時間が大幅に短縮されたことを報告しており、このプラットフォームによって貴重なGPU時間を実際のワークロードに節約できることを強調しています。
Cluster Directorのユーザーフレンドリーなコンソールビューでは、最適化されたリファレンスアーキテクチャの選択から始めて、クラスターの作成、更新、削除を簡単に行うことができます。ユーザーは、さまざまなマシン構成、消費モデル、ストレージオプションを使用してクラスターをカスタマイズし、高性能なファイルシステムに容易にアクセスできるようになります。また、このプラットフォームは、必要なファイアウォールルールを自動的に設定し、新しいVPCネットワークと既存のVPCネットワークのいずれかを選択できるようにすることで、ネットワーク設定を簡素化します。
プラットフォームのマネージドSlurm環境は、ユーザーがカスタマイズ可能な事前構成済みのパーティションとノードセットを備えた、スケーラブルなジョブスケジューリングを提供します。Cluster DirectorはGoogleのネットワークトポロジと統合されているため、VMを物理的に近接して配置できます。また、Slurmスケジューラのトポロジ認識機能は、タスクのコロケーションを最適化してレーテンシーを最小限に抑えます。さらに、オブザーバビリティダッシュボードはクラスタの健全性とパフォーマンスに関する包括的な分析情報を提供し、高度な診断機能はパフォーマンスの異常を特定して解決するのに役立ちます。

