Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
%20(1).webp)
Deepgram、人間のような AI 会話を実現する音声エージェントAPIを発表
Generatived
24/9/20 3:30
サンフランシスコ、2024年9月19日 – Deepgramは、人間とAIエージェント間のリアルタイムで自然な会話を可能にする最新のイノベーションであるDeepgram Voice Agent APIを発表しました。同社のプラットフォームに新たに追加されたこのAPIは、組織が人間の対話者と同じレベルの知性と明瞭さで聞き取り、応答できるAIエージェントを作成できるように設計されています。
BARC US の VP である Kevin Petrie 氏は、音声による対話のトレンドが高まっていること、およびテキストベースの会話を音声に変換することで顧客サービスを向上させる Deepgram の技術の可能性についてコメントしました。また、API がさまざまな大規模言語モデルと互換性があることにも言及し、さまざまなエンタープライズ シナリオにアプリケーションを拡張できる可能性があると述べました。
Deepgram の音声 AI における 10 年近くにわたる豊富な経験が、この高度なサービスの開発につながりました。同社の音声エージェント スタックは、レーテンシーを最小限に抑えるように設計されており、迅速かつ自然な応答を保証します。このリリースは、人間の介入なしに複雑なタスクを処理できる完全に自律的な音声エージェントを作成するという目標に向けた大きな一歩です。
今後、Deepgram の AI エージェントは、中断中に適切な休止や継続など、人間のような巧妙さで会話のニュアンスを巧みに処理することが期待されています。音声システムの将来には、コンテキスト インテリジェンスの統合が含まれ、感情表現とコンテキスト認識による対話が可能になります。Deepgram の CEO である Scott Stephenson 氏は、AI システムの主要なインターフェイスとしての音声の変革の可能性を強調し、職場で音声エージェントが普及するにつれて生産性が急上昇すると予測しました。

