Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo
%20(1).webp)
Tiện ích mở rộng Trợ lý AI bằng giọng nói của CyberAgent AI Lab
Generatived
0:00 9/12/25
Là kỹ sư hệ thống hội thoại tại Phòng thí nghiệm AI CyberAgent (Tokyo), Ohira tham gia vào việc triển khai các kết quả nghiên cứu vào xã hội. Kể từ năm 2024, với sự phát triển của Generative AI), trợ lý AI kích hoạt bằng giọng nói đã nhanh chóng lan rộng khắp xã hội. AI giọng nói ngày càng được sử dụng rộng rãi trong nhiều tình huống, bao gồm các cuộc gọi điện thoại, hỗ trợ khách hàng trực tuyến và hướng dẫn sản phẩm trên trang thương mại điện tử.
Khi tình trạng thiếu hụt lao động trở thành vấn đề do tỷ lệ sinh giảm và dân số già hóa, AI đối thoại bằng giọng nói được kỳ vọng sẽ tạo ra những kết nối cảm xúc giống con người và làm sâu sắc thêm mối quan hệ với khách hàng. Vapi, một nền tảng giải quyết các vấn đề trong lĩnh vực này, đang thu hút sự chú ý, và tiềm năng cũng như thách thức của nó đang được xem xét.
Bessemer Venture Partners đã đầu tư 20 triệu đô la vào nền tảng AI giọng nói "Vapi", chứng minh tiềm năng của nó như một cơ sở hạ tầng giọng nói thế hệ tiếp theo. Một bản demo kết hợp Vapi với chip suy luận tốc độ cao Groq đã thu hút sự chú ý trên mạng xã hội, và được kỳ vọng sẽ là một giải pháp giải quyết những thách thức kỹ thuật về "rào cản latency " và "ngắt tự nhiên".
Vapi có thể được tích hợp với Twilio dưới dạng AI điện thoại hoặc API Web, cho phép tương tác bằng giọng nói theo thời gian thực. Nó cho phép tạo ra các hệ thống tương tác bằng giọng nói mà không cần lập trình, và bao gồm tất cả các tính năng cần thiết cho việc triển khai xã hội, chẳng hạn như ghi âm và hỗ trợ đa ngôn ngữ. Nó cũng cung cấp khả năng tùy chỉnh linh hoạt và dự kiến sẽ được áp dụng trong thế giới thực.
Chia sẻ bài viết này:

