Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
%20(1).webp)
Google、 Gemini Native Audioを強化、ライブ翻訳を導入
Generatived
25/12/16 0:00
Gemini 2.5 Flash Native Audio が強化され、ライブ音声エージェントにより自然な会話体験を提供します。このアップデートは、 Google AI Studio やVertex AI を含む様々なGoogle製品で利用可能となり、複雑なワークフロー管理、ユーザー指示ナビゲーション、そして会話全体の自然さの向上を目指しています。これらの新機能は Gemini Live と Search Live にも導入されており、Search Live にネイティブオーディオが統合されるのは今回が初めてとなります。
アップデートされたモデルは、関数呼び出しの精度向上など、いくつかの改善点を備えています。例えば、複数ステップの関数呼び出しを評価するComplexFuncBench Audioでは、71.5%のスコアを獲得しました。また、開発者の指示への準拠率も90%に向上し、複数ターンの会話品質も大幅に向上しました。これらの機能強化により、ユーザーと音声エージェント間のインタラクションの信頼性と一貫性が向上します。
会話機能の改善に加え、Gemini はライブ音声翻訳機能も搭載し、機能を拡張しています。GoogleGoogleアプリでベータ版として提供されているこの機能は、話者のイントネーション、ペース、ピッチを維持しながら、ストリーミング音声翻訳を実現します。70 以上の言語と 2,000 以上の言語ペアに対応し、複数の言語を同時に理解し、騒がしい環境でも話されている言語を自動的に検出して翻訳します。
ライブ音声翻訳は現在、米国、メキシコ、インドのAndroidデバイス向けに展開されており、将来的にはiOSおよびその他の地域にも展開される予定です。ユーザーは、デバイスにヘッドフォンを接続し、「ライブ翻訳」を選択することでベータ版を利用できます。Gemini 2.5 Flash Native AudioはVertex AIで一般公開されており、Gemini APIではプレビュー版が利用可能です。Gemini 2.5 Flashおよび2.5 Proのテキスト読み上げモデルは、 Google AI StudioのGemini APIからアクセスできます。
最新のニュース
TechSuite AI記事代行ヤマダデンキ効果
25/12/16 0:00
TechSuite(本社所在地)は、生成AIを活用したコンテンツマーケティング支援サービス「バクヤスAI 記事代行」の導入効果について、ヤマダデンキ(本社所在地)の星野様にインタビューし、その動画を公開した。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
TechSuite AI記事代行ヤマダデンキ効果
25/12/16 0:00
TechSuite(本社所在地)は、生成AIを活用したコンテンツマーケティング支援サービス「バクヤスAI 記事代行」の導入効果について、ヤマダデンキ(本社所在地)の星野様にインタビューし、その動画を公開した。



%20(1).webp)


