top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA、 Azure上のサーバーレス GPU Spark を発表

Generatived

25/7/25 0:00

テキストを数値データに変換するプロセス(埋め込み)は、生成AIの機能にとって極めて重要です。セマンティック検索やレコメンデーションシステムなどの技術は、大規模言語モデル(LLM)やその他のAIモデルがデータを理解できるようにするために、埋め込みを利用しています。Apache Sparkは、大規模な埋め込み生成を処理するために、データ処理タスクを複数のクラスターに分散するために広く使用されています。しかし、埋め込み生成には膨大な計算量が必要となるため、アクセラレーションコンピューティングが必要となり、GPUインフラストラクチャの管理が複雑化します。

最近のデモでは、サーバーレスGPUを搭載したAzure Container Apps (ACA) 上に分散型Sparkアプリケーションをデプロイすることで、これらの課題に対処できることを示しました。この構成により、Sparkで大規模なデータセットを管理できると同時に、ACAによってコンピューティング管理とスケーリングの複雑さが簡素化されます。デモでは、NVIDIA RAPIDS Accelerator for Sparkなどの高性能ライブラリとHugging Faceのオープンソースモデルを統合した専用のワーカーコンテナを作成し、スケーラブルなソリューションを提供しました。

その結果、AIおよびデータ処理アプリケーションに高スループットと低レーテンシーを提供する、サーバーレスで従量課金制のプラットフォームが実現しました。このアプローチは、さまざまなニーズに容易に適応できる汎用性の高いテンプレートとして機能します。最高のパフォーマンスとサポートを求める企業向けには、カスタムメイドのワーカーではなく、NVIDIA NIMマイクロサービスを組み込むことで、アーキテクチャを強化できます。

このソリューションのアーキテクチャはシンプルかつ効果的で、 Azure Container Apps 環境内の 2 つの主要なサーバーレス コンテナー アプリケーションで構成されています。Apache Spark フロントエンド コントローラー アプリケーションはワークロードをオーケストレーションし、ジョブの送信を受け付けます。一方、GPU アクセラレーションを活用した Spark ワーカー アプリケーションはデータ処理を担当します。Azure Files を使用した共有データ ストレージ レイヤーにより、Azureとワーカー間でのコード、モデル、データの共有が容易になり、開発とデプロイが効率化されます。

このソリューションを実装するには、 Azureサブスクリプション、テキストデータを含むSQL Server インスタンス、そしてAzure Container Apps、Apache Spark、 Docker、 Pythonに関する知識が必要です。GitHubGitHubAzure-Serverless-GPU-Embedding には、開始するためのサンプルコードが用意されています。デプロイプロセスには、Spark コントローラーアプリケーションのセットアップ、GPU アクセラレーション対応 Spark ワーカーアプリケーションのデプロイ、分散テキスト埋め込みジョブの実行が含まれます。これらのジョブは、開発モードでは Jupyter を使用し、実稼働モードでは HTTP トリガーを使用して実行できます。

Azure Container Apps のサーバーレス GPU 上でカスタム GPU アクセラレーション Apache Spark アプリケーションを活用することで、組織はインフラストラクチャ管理の煩わしさなしに、効率的でスケーラブル、かつコスト効率に優れた分散データ処理ソリューションを構築できます。このサーバーレス モデルでは、AI ワークロードの需要に合わせて GPU リソースを動的にスケーリングできます。Jupyter ベースの開発環境から本番環境対応のシステムへ、同じフレームワーク内で移行できる柔軟性により、困難なデータタスクを本番環境へと容易に移行できます。パフォーマンスとサポートを強化するために、NVIDIA NIM マイクロサービスをアーキテクチャに統合することも可能です。関心のある方は、NVIDIA/GenerativeAIExamples GitHubリポジトリのコードにアクセスし、「 Azure Container Apps のサーバーレス GPU で次世代 AI アプリをセキュリティ保護」というデモ ウォークスルーで詳細をご確認ください。

この記事を共有:

最新のニュース
LazyAIメール自動化サービス開始

LazyAIメール自動化サービス開始

26/2/18 0:00

LazyAI(東京都文京区)は、AIを活用したメール自動化サービス「LazyAI for Mail」を開始。

リーガルテックMyTokkyo.Ai知財AI革新

リーガルテックMyTokkyo.Ai知財AI革新

26/2/18 0:00

リーガルテック(東京都港区)が展開する「MyTokkyo.Ai」は、知財AIプラットフォームとして、特許出願件数を重視する従来の知財評価に変化をもたらしている。

FORWARD英語力とAI翻訳ツール調査

FORWARD英語力とAI翻訳ツール調査

26/2/18 0:00

ランゲージ・ティーチング・レボリューションズ(東京都渋谷区)が運営する「FORWARD」は、英語を使うビジネスパーソンを対象にAI翻訳ツールと自らの英語力の使い分けに関する調査を行った。

CLYR新Webサービス「Casually」開始

CLYR新Webサービス「Casually」開始

26/2/18 0:00

CLYR(東京都目黒区)は、AIを駆使したWebサービス「Casually」を2026年2月17日に開始した。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
LazyAIメール自動化サービス開始

LazyAIメール自動化サービス開始

26/2/18 0:00

LazyAI(東京都文京区)は、AIを活用したメール自動化サービス「LazyAI for Mail」を開始。

リーガルテックMyTokkyo.Ai知財AI革新

リーガルテックMyTokkyo.Ai知財AI革新

26/2/18 0:00

リーガルテック(東京都港区)が展開する「MyTokkyo.Ai」は、知財AIプラットフォームとして、特許出願件数を重視する従来の知財評価に変化をもたらしている。

FORWARD英語力とAI翻訳ツール調査

FORWARD英語力とAI翻訳ツール調査

26/2/18 0:00

ランゲージ・ティーチング・レボリューションズ(東京都渋谷区)が運営する「FORWARD」は、英語を使うビジネスパーソンを対象にAI翻訳ツールと自らの英語力の使い分けに関する調査を行った。

CLYR新Webサービス「Casually」開始

CLYR新Webサービス「Casually」開始

26/2/18 0:00

CLYR(東京都目黒区)は、AIを駆使したWebサービス「Casually」を2026年2月17日に開始した。

bottom of page