Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

リアルタイムテック、強化されたgpt-realtime音声モデルを発表
Generatived
25/9/1 0:00
音声技術の最新の進歩は、強化された音声合成モデル「gpt-realtime」とRealtime APIの拡張機能のリリースにより明らかになりました。このAPIは、リモートMCPサーバー、画像入力、SIP通話との統合を容易にし、開発者や企業に、より高度で応答性の高い音声エージェントを開発するためのツールを提供します。これらのエージェントは、追加のコンテキストと機能を活用することで、より幅広いタスクを処理できるようになります。
gpt-realtimeモデルは音声合成における大きな飛躍的進歩であり、より自然で表現力豊かな音声を実現します。複雑な指示の理解に優れ、文の途中で言語を切り替えることができるため、カスタマーサポートやその他のインタラクティブアプリケーションにおけるユーザーエクスペリエンスが向上します。このモデルの理解力の向上は、システムメッセージや開発者のプロンプトをより正確に解釈する能力に表れています。さらに、 CedarとMarinという2つの新しい音声が追加され、Realtime APIを通じて利用できる音声オプションの多様性がさらに向上しました。
Realtime APIは、パブリックベータ版のリリース以降、信頼性、低レーテンシー、高品質なオーディオ制作に重点を置いて最適化されています。この単一モデルAPIアプローチは、オーディオ生成プロセスを効率化し、レーテンシーを低減し、音声のニュアンスを維持します。gpt-realtimeモデルは、詳細な指示に従い、ツールを正確に呼び出すようにトレーニングされており、様々な本番環境に音声エージェントを導入するための堅牢なソリューションとなっています。
開発者の皆様は、一般提供開始となったRealtime APIと新しいgpt-realtimeモデルをご利用いただけるようになりました。これらのAPIは、以前の提供価格と比べて20%の値下げとなっています。APIの料金体系は、特に長時間セッションにおいて費用対効果が高くなるよう設計されており、開発者はインテリジェントなトークン制限を設定し、会話を効率的に切り捨てることができます。これらの新機能にご興味のある方は、統合と導入を容易にするための包括的なドキュメントとテストプレイグラウンドをご利用いただけます。
最新のニュース
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。