Azure AIは人工知能サービスのポートフォリオを拡大し、顧客の音声データを解釈する能力を強化した。同社の音声テキスト変換サービスには、Azure OpenAI ServiceとAzure AI Speechの機能が含まれており、多言語音声の文字起こしと翻訳の開発を支援する上で極めて重要だ。これらのサービスは、ほぼリアルタイムのサポートを必要とする顧客サービス担当者にとって特に有益だ。

同社は最近、オーディオファイルを書き起こすために設計されたモデルであるOpenAI Whisper on Azureの一般提供を発表した。開発者は、Azureのエンタープライズグレードのサポートを保証しながら、Azure OpenAI ServiceとAzure AI Speechサービスの両方を通じてWhisper APIを運用ワークロードに統合できるようになった。このリリースでは、AIを活用した文字起こしやその他の音声アプリケーションの幅広い選択肢と適応性をお客様に提供する。

Whisper APIはパブリックプレビュー以来、医療や教育を含むさまざまな分野で採用されてきた。ユーザーはAPIを活用して、音声を複数の言語のテキストに翻訳および文字起こしし、キャプションによるアクセシビリティーを強化し、音声およびビデオコンテンツから洞察を抽出する。OpenAIモデルのAzureへの統合は継続されており、顧客のさまざまなユースケースに合わせて音声テクノロジーと大規模言語モデル(LLM)を強化することを目指している。

Azure OpenAI Serviceでは、開発者がOpenAIのWhisperモデルを利用できるようになった。これにより、高速処理、複数言語のサポート、文字起こしと翻訳の機能が提供される。コールセンターワークフローのAIイノベーターであるLightbulb.aiは、WhisperをLLMと組み合わせて使用​​することで、スケーラビリティー、速度、費用対効果が大幅に向上したと報告している。同社は、Azureとのパートナーシップが成功の重要な要因であることを認めている。Whisperモデルに興味のある開発者には、Azure OpenAI Studioがアクセスを提供し、Azure AI Speech Studioは大規模な音声コンテンツのバッチ文字起こしサービスを提供する。

ソース:Latest news - Source, Microsoft