Assembly AIの2023年7月28日のブログ投稿によると、同社は音声データに基づいたLarge Language Models (LLM)アプリケーションの開発を簡素化するユーザーフレンドリーなプラットフォーム「LeMUR」を発表した。LeMURを使用すると、開発者は、単一のAPI呼び出しを使用して、アプリケーションの音声データから抽出された知識を使用して、検索、要約、質問応答、テキスト生成を簡単に実行できる。

会議、電話、ビデオ、ポッドキャストなどの音声データを利用するAIアプリケーションの需要が高まる中、LeMURは、自動"AI stack"起こしと、プロンプト拡張、圧縮戦略、検索技術、言語モデル、そして構造化されたアウトプットが可能。この包括的なアプローチにより、開発者は最小限のコード行で音声データを処理できるようになり、より幅広い聴衆が音声データにアクセスできるようになる。

ブログ投稿で述べられているように、LeMURを使用すると、ユーザーは会議を要約してアクションアイテムを抽出したり、通話中に洞察を得るために質問をしたり、キャッチーなタイトルや説明を生成したりするなど、さまざまなAIアプリを作成できる。コアタスクの精度が高いことが特徴で、カスタマイズ可能なエンドポイントを使用してカスタムユースケースに対応するように拡張できる。

同プラットフォームの早期アクセスバージョンは4月にリリースされ、現在は全てのユーザーが利用できるようになっており、新しいエンドポイント、出力の精度の向上、入力および出力の制限の拡張が提供されている。開発者は、LeMURのSummarizationエンドポイントを利用して仮想会議や電話通話を自動的に要約し、質疑応答機能を使用して音声データから回答を取得し、アクションアイテム機能を利用して仮想会議からアクションアイテムのリストを生成できる。

Assembly AIによると、興味のあるユーザーは、APIプレーグラウンドを通じて、APIサインアップ後に無料のAPIトークンを使用してAPI経由で直接LeMURを試すことができる。