top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA、 Azure上のサーバーレス GPU Spark を発表

Generatived

25/7/25 0:00

テキストを数値データに変換するプロセス(埋め込み)は、生成AIの機能にとって極めて重要です。セマンティック検索やレコメンデーションシステムなどの技術は、大規模言語モデル(LLM)やその他のAIモデルがデータを理解できるようにするために、埋め込みを利用しています。Apache Sparkは、大規模な埋め込み生成を処理するために、データ処理タスクを複数のクラスターに分散するために広く使用されています。しかし、埋め込み生成には膨大な計算量が必要となるため、アクセラレーションコンピューティングが必要となり、GPUインフラストラクチャの管理が複雑化します。

最近のデモでは、サーバーレスGPUを搭載したAzure Container Apps (ACA) 上に分散型Sparkアプリケーションをデプロイすることで、これらの課題に対処できることを示しました。この構成により、Sparkで大規模なデータセットを管理できると同時に、ACAによってコンピューティング管理とスケーリングの複雑さが簡素化されます。デモでは、NVIDIA RAPIDS Accelerator for Sparkなどの高性能ライブラリとHugging Faceのオープンソースモデルを統合した専用のワーカーコンテナを作成し、スケーラブルなソリューションを提供しました。

その結果、AIおよびデータ処理アプリケーションに高スループットと低レーテンシーを提供する、サーバーレスで従量課金制のプラットフォームが実現しました。このアプローチは、さまざまなニーズに容易に適応できる汎用性の高いテンプレートとして機能します。最高のパフォーマンスとサポートを求める企業向けには、カスタムメイドのワーカーではなく、NVIDIA NIMマイクロサービスを組み込むことで、アーキテクチャを強化できます。

このソリューションのアーキテクチャはシンプルかつ効果的で、 Azure Container Apps 環境内の 2 つの主要なサーバーレス コンテナー アプリケーションで構成されています。Apache Spark フロントエンド コントローラー アプリケーションはワークロードをオーケストレーションし、ジョブの送信を受け付けます。一方、GPU アクセラレーションを活用した Spark ワーカー アプリケーションはデータ処理を担当します。Azure Files を使用した共有データ ストレージ レイヤーにより、Azureとワーカー間でのコード、モデル、データの共有が容易になり、開発とデプロイが効率化されます。

このソリューションを実装するには、 Azureサブスクリプション、テキストデータを含むSQL Server インスタンス、そしてAzure Container Apps、Apache Spark、 Docker、 Pythonに関する知識が必要です。GitHubGitHubAzure-Serverless-GPU-Embedding には、開始するためのサンプルコードが用意されています。デプロイプロセスには、Spark コントローラーアプリケーションのセットアップ、GPU アクセラレーション対応 Spark ワーカーアプリケーションのデプロイ、分散テキスト埋め込みジョブの実行が含まれます。これらのジョブは、開発モードでは Jupyter を使用し、実稼働モードでは HTTP トリガーを使用して実行できます。

Azure Container Apps のサーバーレス GPU 上でカスタム GPU アクセラレーション Apache Spark アプリケーションを活用することで、組織はインフラストラクチャ管理の煩わしさなしに、効率的でスケーラブル、かつコスト効率に優れた分散データ処理ソリューションを構築できます。このサーバーレス モデルでは、AI ワークロードの需要に合わせて GPU リソースを動的にスケーリングできます。Jupyter ベースの開発環境から本番環境対応のシステムへ、同じフレームワーク内で移行できる柔軟性により、困難なデータタスクを本番環境へと容易に移行できます。パフォーマンスとサポートを強化するために、NVIDIA NIM マイクロサービスをアーキテクチャに統合することも可能です。関心のある方は、NVIDIA/GenerativeAIExamples GitHubリポジトリのコードにアクセスし、「 Azure Container Apps のサーバーレス GPU で次世代 AI アプリをセキュリティ保護」というデモ ウォークスルーで詳細をご確認ください。

この記事を共有:

最新のニュース
リーガルテック技術戦略OS提供開始

リーガルテック技術戦略OS提供開始

26/2/18 0:00

リーガルテック(東京都港区)は、AIを活用して企業内の技術判断を一元化し、迅速化する「技術戦略OS」の提供を開始した。

AI Ops Manager人材育成プラットフォーム

AI Ops Manager人材育成プラットフォーム

26/2/18 0:00

AI Ops Managerは、AIを現場に活かす人材を育成するプラットフォームを提供している。

グラファー石井新著AI開発生産性向上

グラファー石井新著AI開発生産性向上

26/2/18 0:00

グラファー(東京都渋谷区)は、代表取締役石井大地の新著『AI駆動開発チームの作り方・育て方 生産性20倍アップのソフトウェア開発』を2026年2月15日に発売した。

ORENDA AI音声合成ストリーミング対応

ORENDA AI音声合成ストリーミング対応

26/2/18 0:00

ORENDA WORLD(東京都港区)は、自社開発のAI音声合成ソリューション「NEXPEEECH®」がストリーミング再生に対応したと発表した。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
リーガルテック技術戦略OS提供開始

リーガルテック技術戦略OS提供開始

26/2/18 0:00

リーガルテック(東京都港区)は、AIを活用して企業内の技術判断を一元化し、迅速化する「技術戦略OS」の提供を開始した。

AI Ops Manager人材育成プラットフォーム

AI Ops Manager人材育成プラットフォーム

26/2/18 0:00

AI Ops Managerは、AIを現場に活かす人材を育成するプラットフォームを提供している。

グラファー石井新著AI開発生産性向上

グラファー石井新著AI開発生産性向上

26/2/18 0:00

グラファー(東京都渋谷区)は、代表取締役石井大地の新著『AI駆動開発チームの作り方・育て方 生産性20倍アップのソフトウェア開発』を2026年2月15日に発売した。

ORENDA AI音声合成ストリーミング対応

ORENDA AI音声合成ストリーミング対応

26/2/18 0:00

ORENDA WORLD(東京都港区)は、自社開発のAI音声合成ソリューション「NEXPEEECH®」がストリーミング再生に対応したと発表した。

bottom of page