Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

GoogleがAIエッジスタックにオーディオ機能を追加
Generatived
25/9/11 0:00
Googleは最近、AI Edgeスタックにオーディオ機能を追加すると発表しました。Gemma 3nは、この機能強化を搭載した最初のモデルとなります。高品質な音声テキスト変換や音声翻訳テキスト生成などの新しいオーディオ機能は、 AndroidプラットフォームとWebプラットフォームの両方でMediaPipe LLM推論APIを通じて利用できます。このAPIは当初、最大30秒のオーディオクリップのバッチ推論をサポートし、将来的にはストリーミングオーディオのサポートも導入する予定です。
Googleは、新しい音声機能を紹介するため、AI Edge Galleryアプリをアップデートし、「Audio Scribe」機能を導入しました。この機能により、ユーザーはインターネット接続を必要とせず、音声クリップやライブ録音をデバイス上で直接書き起こすことができます。既に50万回以上のAPKダウンロードを記録し、大きな反響を得ているAI Edge Galleryアプリは、開発者に実用的な例と透明性のあるパフォーマンス指標を提供することを目的としています。
アクセシビリティ向上のため、 GoogleはAI Edge GalleryをGoogle Playストアでオープンベータ版として公開するとともに、 GitHubで完全なソースコードの提供を継続しています。この二重のアプローチにより、開発者はデモを簡単に体験できるだけでなく、コードベースを深く掘り下げることも可能になります。今後、 Googleはアプリの機能を拡張し、iOSユーザーへの提供、AI生成タスクの追加、開発者の柔軟性向上のための新しいオープンソースランタイムへの移行、そしてコミュニティとの連携によるオープンソースモデルの公開などを進めていく予定です。
最新のニュース
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。



%20(1).webp)


