Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Google ra mắt mô hình Gemini 3.1 Flash TTS.
Generatived
0:00 20/4/26
Google đã giới thiệu Gemini 3.1 Flash TTS, một mô hình chuyển văn bản thành giọng nói mới hiện đang được triển khai cho các nhà phát triển, doanh nghiệp và người dùng trên tất cả các nền tảng của mình, bao gồm cả Gemini API và Vertex AI.
Mô hình này được cho là mang lại chất lượng giọng nói, khả năng biểu cảm và khả năng điều khiển được cải thiện, hỗ trợ hội thoại đa người nói và hơn 70 ngôn ngữ, đồng thời đạt được kết quả đánh giá chuẩn mực cao.
Các thẻ âm thanh mới cho phép các nhà phát triển kiểm soát giọng điệu, tốc độ và cách truyền đạt thông qua các lời nhắc bằng ngôn ngữ tự nhiên, cho phép tùy chỉnh chi tiết hơn và đầu ra giọng nói nhất quán trên các ứng dụng.
Tất cả âm thanh được tạo ra đều được nhúng mã watermark SynthID, đảm bảo khả năng nhận diện nội dung do AI tạo ra, đồng thời công ty hướng đến mục tiêu hỗ trợ các ứng dụng dựa trên giọng nói có khả năng mở rộng trên toàn cầu.
Chia sẻ bài viết này:

