top of page
Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

Vertex AI、Claudeのマルチリージョン提供
Generatived
26/4/28 0:00
Google Cloudは、Vertex AI上でClaudeのマルチリージョンエンドポイントの公開プレビュー提供を開始した。米国およびEUで利用可能となり、複数リージョンにまたがる動的ルーティングにより、信頼性と可用性の向上を実現する。
従来の単一リージョンエンドポイントは低レイテンシ、グローバルエンドポイントは最大容量とコスト効率に強みがあったが、新たなマルチリージョンはその中間に位置する。特定地域内でトラフィックを自動分散しながら、データ所在地要件を満たす点が特徴となる。
本機能により、企業はデータを米国またはEU内に保持しつつ、単一リージョン障害の影響を回避できる。フェイルオーバーやトラフィック管理も自動化され、分散アーキテクチャの運用負担を軽減する。
さらに、プロンプトキャッシュにも完全対応し、既存キャッシュが存在するリージョンへ優先的にルーティングすることで、低レイテンシとコスト最適化を実現する。Google Cloudは、本機能を本番環境における標準選択肢として推奨している。

