Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Realtime Tech công bố mô hình giọng nói gpt-realtime nâng cao
Generatived
0:00 1/9/25
Những tiến bộ mới nhất trong công nghệ giọng nói được thể hiện rõ qua việc phát hành mô hình tổng hợp giọng nói nâng cao "gpt-realtime" và những cải tiến cho API Thời gian thực. API này đơn giản hóa việc tích hợp với máy chủ MCP từ xa, chụp ảnh và gọi SIP, cung cấp cho các nhà phát triển và doanh nghiệp các công cụ để xây dựng các tác nhân giọng nói tiên tiến và nhạy bén hơn. Các tác nhân này sau đó có thể tận dụng ngữ cảnh và khả năng bổ sung để xử lý nhiều tác vụ hơn.
Mô hình gpt-realtime đại diện cho một bước đột phá lớn trong tổng hợp giọng nói, mang lại giọng nói tự nhiên và biểu cảm hơn. Nó vượt trội trong việc hiểu các hướng dẫn phức tạp và có thể chuyển đổi ngôn ngữ giữa câu, cải thiện trải nghiệm người dùng trong hỗ trợ khách hàng và các ứng dụng tương tác khác. Khả năng hiểu được cải thiện của mô hình này thể hiện rõ qua khả năng diễn giải chính xác hơn các thông báo hệ thống và lời nhắc của nhà phát triển. Ngoài ra, hai giọng nói mới, Cedar và Marin, đã được bổ sung, giúp tăng thêm sự đa dạng của các tùy chọn giọng nói có sẵn thông qua API thời gian thực.
Kể từ khi phát hành phiên bản beta công khai, API thời gian thực đã được tối ưu hóa, tập trung vào độ tin cậy, latency thấp và chất lượng sản xuất âm thanh cao. Phương pháp API mô hình đơn này hợp lý hóa quy trình tạo âm thanh, giảm latency và giữ nguyên sắc thái của giọng nói. Mô hình gpt-realtime được đào tạo để tuân theo các hướng dẫn chi tiết và gọi các công cụ một cách chính xác, biến nó thành một giải pháp mạnh mẽ để triển khai các tác nhân giọng nói trong nhiều môi trường sản xuất khác nhau.
Giờ đây, các nhà phát triển có thể tận dụng API thời gian thực phổ biến và mô hình gpt-realtime mới. API này có giá giảm 20% so với các dịch vụ trước đây. Giá API được thiết kế để tiết kiệm chi phí, đặc biệt là cho các phiên làm việc dài, và các nhà phát triển có thể đặt giới hạn mã thông báo thông minh và cắt ngắn các cuộc trò chuyện một cách hiệu quả. Đối với những người quan tâm đến việc dùng thử các tính năng mới này, tài liệu hướng dẫn toàn diện và sân chơi thử nghiệm có sẵn để dễ dàng tích hợp và áp dụng.
Chia sẻ bài viết này:
Tin tức mới nhất
Bắt đầu tạo hình ảnh Flash Google Gemini 2.5
0:00 4/9/25
Google(Hoa Kỳ) hôm nay đã công bố tính năng tạo và chỉnh sửa hình ảnh gốc bằng Gemini 2.5 Flash.
Microsoft cung cấp dịch vụ AI và đám mây cho các cơ quan chính phủ Hoa Kỳ
0:00 4/9/25
Microsoft đã ký một hợp đồng lớn với Cơ quan Quản lý Dịch vụ Tổng hợp Hoa Kỳ (GSA) để cung cấp nhiều dịch vụ năng suất, đám mây và AI cho các cơ quan liên bang.
Microsoft công bố Argus là người chiến thắng Imagine Cup
0:00 4/9/25
Hàng năm, Microsoft Imagine Cup tôn vinh tài năng của các sinh viên khởi nghiệp và khuyến khích họ phát triển các giải pháp sáng tạo tận dụng công nghệ Microsoft.
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
Bắt đầu tạo hình ảnh Flash Google Gemini 2.5
0:00 4/9/25
Google(Hoa Kỳ) hôm nay đã công bố tính năng tạo và chỉnh sửa hình ảnh gốc bằng Gemini 2.5 Flash.
Microsoft cung cấp dịch vụ AI và đám mây cho các cơ quan chính phủ Hoa Kỳ
0:00 4/9/25
Microsoft đã ký một hợp đồng lớn với Cơ quan Quản lý Dịch vụ Tổng hợp Hoa Kỳ (GSA) để cung cấp nhiều dịch vụ năng suất, đám mây và AI cho các cơ quan liên bang.
Microsoft công bố Argus là người chiến thắng Imagine Cup
0:00 4/9/25
Hàng năm, Microsoft Imagine Cup tôn vinh tài năng của các sinh viên khởi nghiệp và khuyến khích họ phát triển các giải pháp sáng tạo tận dụng công nghệ Microsoft.