top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA RTX PRO 6000がGoogle Cloud Runを強化

Generatived

26/2/4 0:00

サーバーレスコンピューティングの最新技術として、Cloud RunにNVIDIA RTX PRO™ 6000 Blackwell Server Edition GPUが導入されました。この統合により、ユーザーはGemma 3 27BやLlama 3.1 70Bといった大規模推論モデルを、手動によるクラスタ管理やVMのメンテナンスを必要とせずにデプロイできます。このサービスは、シームレスな「デプロイして忘れる」体験を約束し、予約の必要がなくなり、運用プロセスを簡素化します。

NVIDIAのRTX PRO 6000 Blackwell GPUは、96GBのvGPUメモリと1.6TB/sの帯域幅を誇り、従来モデルと比べて大幅なパフォーマンス向上を実現しています。このアップグレードにより、700億を超えるパラメータを持つモデルの処理が容易になります。Cloud Runユーザーは、これらのGPUをサービス、ジョブ、またはワーカープールにオンデマンドで接続できるようになり、ハイエンドの推論タスクの実行プロセスを効率化できます。

新しいGPUは、FP4精度をサポートし、リアルタイムAIアプリケーションの作成を可能にするため、生成AIおよび推論アプリケーションに特に有益です。Cloud Runの高速起動およびスケーリング機能により、インストールされたドライバーを備えたGPUインスタンスは5秒以内に準備完了となり、需要が減少すると自動的にゼロまでスケールダウンされます。さらに、GPUはモデルの微調整やコンテンツ制作の強化にも活用でき、特殊なワークロードに合わせてスケーリングを柔軟に調整できます。

Cloud Runは、本番環境でGPUアクセラレーションタスクを実行するためのシンプルなソリューションを提供するように設計されています。マネージドGPUに、最大44個のvCPUと176GBのRAMを含む柔軟なコンピューティングオプションを提供し、ゾーン冗長性により本番環境レベルの信頼性を確保します。このプラットフォームはGoogle Cloudと緊密に統合されており、Cloud Storageバケットのマウントと、Identity-Aware Proxy(IAP)による安全なトラフィック管理が可能です。

この記事を共有:

最新のニュース
TechSuite AI検索最適化支援開始

TechSuite AI検索最適化支援開始

26/3/24 0:00

TechSuite(東京都港区)は、AI検索最適化のコンサルティングサービス「AI検索パートナーズ」を2026年3月に開始した。

DNPとオラクル製造支援AIサービス

DNPとオラクル製造支援AIサービス

26/3/24 0:00

DNP(東京)は、自社開発の「DNPドキュメント構造化AIサービス」とオラクル(東京)の「Oracle Autonomous AI Database」を組み合わせた新サービスを提供開始すると発表した。

PFN×IIJ×JAIST 国産AI基盤強化プロジェクト

PFN×IIJ×JAIST 国産AI基盤強化プロジェクト

26/3/24 0:00

Preferred Networks(東京)はインターネットイニシアティブ(東京)、北陸先端科学技術大学院大学(石川県)と共に、経済産業省とNEDOの公募に採択されたプロジェクトを進行中。

NTT東日本 AI電話応対支援開始

NTT東日本 AI電話応対支援開始

26/3/23 0:00

NTT東日本(東京)は、固定電話の応対業務をAIが支援する「おまかせAIでんわ」を2026年4月20日に提供開始すると発表した。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
TechSuite AI検索最適化支援開始

TechSuite AI検索最適化支援開始

26/3/24 0:00

TechSuite(東京都港区)は、AI検索最適化のコンサルティングサービス「AI検索パートナーズ」を2026年3月に開始した。

DNPとオラクル製造支援AIサービス

DNPとオラクル製造支援AIサービス

26/3/24 0:00

DNP(東京)は、自社開発の「DNPドキュメント構造化AIサービス」とオラクル(東京)の「Oracle Autonomous AI Database」を組み合わせた新サービスを提供開始すると発表した。

PFN×IIJ×JAIST 国産AI基盤強化プロジェクト

PFN×IIJ×JAIST 国産AI基盤強化プロジェクト

26/3/24 0:00

Preferred Networks(東京)はインターネットイニシアティブ(東京)、北陸先端科学技術大学院大学(石川県)と共に、経済産業省とNEDOの公募に採択されたプロジェクトを進行中。

NTT東日本 AI電話応対支援開始

NTT東日本 AI電話応対支援開始

26/3/23 0:00

NTT東日本(東京)は、固定電話の応対業務をAIが支援する「おまかせAIでんわ」を2026年4月20日に提供開始すると発表した。

bottom of page