Google Cloud は、音声データの文字起こしを簡素化し、プラットフォームのデータ分析機能と統合する BigQuery の新機能を発表しました。このイノベーションにより、ユーザーはVertex AI 文字起こしモデルを活用し、 SQLを使用して BigQuery 内で直接音声ファイルを文字起こしできるようになりる。この統合は、音声データの分析プロセスを合理化することを目的としています。従来は、分析のためにデータを転記して BigQuery にインポートするには、別個の AI パイプラインとカスタム インフラストラクチャが必要でした。

Google Cloud の Speech to Text V2 API は、ドメイン固有の文字起こしモデルとモデル適応のオプションを提供することで、よりシームレスなエクスペリエンスをユーザーに提供するようになりました。このカスタマイズにより、顧客サービスの通話や医療記録など、さまざまな種類の音声の文字起こしの精度が向上します。さらに、BigQuery のオブジェクト テーブル機能により、きめ細かいアクセス制御が可能になり、安全な転写プロセスとガバナンス プロトコルの順守が保証される。

文字起こしを生成するプロセスは簡単です。ユーザーは文字起こしモデルを BigQuery に登録し、 SQLを使用してオブジェクト テーブルに対してそれを実行しました。結果は BigQuery テーブル内のテキスト列として返されるため、インフラストラクチャの管理を複雑にすることなく、大量の音声データの文字起こしが容易になりる。このアプローチにより、価値実現までの時間が短縮されるだけでなく、機密性の高い顧客データのセキュリティも維持される。

BigQuery は文字起こし以外にも、感情分析や要約など、テキスト データをさらに分析するためのツールを提供しました。ユーザーは、自然言語処理タスクに BigQueryML を使用したり、包括的な分析のために文字起こしされたデータを構造化データと統合したりできる。このプラットフォームは、高度な言語モデル タスク用の PaLM APIの使用もサポートしており、ユーザーが転写されたデータから要約、分類、または Q&A を生成できるようになりる。この統合により、検索および生成 AI アプリケーションの可能性が広がり、ユーザーは音声データからより深い洞察を得ることができるようになりる。

ソース:AI & Machine Learning | Google Cloud Blog