Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

グーグルAIインフラの新展開と超高性能化
Generatived
25/1/28 4:30
Google(東京)は、AIインフラストラクチャの最新進展を発表した。第6世代TPU「Trillium」の提供開始や、NVIDIA H200 GPUを搭載した「A3 Ultra VM」のリリース、Google Kubernetes Engine(GKE)の最大65,000ノードサポートなどが含まれる。また、「Parallelstore」は、HPCとAIワークロード向けの分散ファイルシステムサービスを提供する。
AI Hypercomputerは、Googleの長年の経験に基づくシステムレベルのアプローチで、最適化されたハードウェアとオープンソフトウェア、フレームワーク、柔軟な消費モデルを組み合わせている。Google CloudでAIソリューションを構築する際、専用のインフラストラクチャコンポーネントを選択できる。
A3 Ultra VMは、NVIDIA Hopper GPUを使用し、GPU間ネットワーク帯域幅とHBMが2倍になっている。Titanium MLネットワークアダプタとNVIDIA ConnectX-7 NICを組み合わせ、Googleのデータセンターネットワークと連携して、GPU間で最大3.2 Tbpsの通信を実現する。GKEからも利用可能で、AIワークロードのトレーニングとサービングに役立つ。
Hypercompute Clusterは、AI Hypercomputer上のスーパーコンピューティングサービスプラットフォームで、多数のアクセラレータを一つのユニットとしてデプロイ、管理できる。超低レイテンシネットワーキング、ターゲット設定、高度なメンテナンス管理などの特長を備え、スループットとレジリエンスの目標達成を支援する。LG AI Researchは、これらのインフラストラクチャを活用し、AIイニシアチブを推進している。
Google Cloud TPUは、AI推論において大きな進歩を遂げ、Trillium TPUは前世代のTPU v5eと比較して推論スループットが最大3倍に向上した。Vertex AIやJetStream、MaxDiffusion、Optimum TPU、Hugging Face TGIなど、ユーザーのニーズに応じた複数のサービングオプションが提供されている。Google ColabでもCloud TPU(TPU v5e)がサポートされ、より多くのユーザーがTPUを試せるようになった。
Google Cloudは、AI Hypercomputerを通じてAIインフラストラクチャの限界に挑戦し続ける。新機能を活用し、AIへの取り組みを加速するためのパフォーマンス、効率性、使いやすさを提供することがGoogleの目標である。
最新のニュース
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。


%20(1).webp)



