top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Amazon công bố Nova Sonic AI để tăng cường tương tác bằng giọng nói

Generatived

0:00 10/4/25

Amazon Inc. đã công bố một mô hình AI mới, Amazon Nova Sonic, kết hợp khả năng hiểu giọng nói và tạo giọng nói thành một nền tảng duy nhất. Sáng kiến ​​này nhằm mục đích tăng cường tương tác bằng giọng nói trong các ứng dụng AI, khiến chúng trở nên tự nhiên và giống con người hơn. Mô hình này có thể truy cập thông qua Amazon Bedrock và API phát trực tuyến hai chiều của nó, hợp lý hóa quá trình phát triển các ứng dụng giọng nói trong nhiều lĩnh vực, bao gồm du lịch, chăm sóc sức khỏe và giáo dục.

Rohit Prasad, Phó chủ tịch cấp cao của Amazon AI (Trí tuệ nhân tạo), nhấn mạnh rằng Amazon luôn đi đầu trong công nghệ giọng nói, từ Alexa đến AWS service . Nova Sonic là bước tiến lớn trong việc đơn giản hóa quy trình phát triển cho các ứng dụng nhận dạng giọng nói và cải thiện độ chính xác cũng như sự tương tác của người dùng.

Nova Sonic giải quyết sự phức tạp của quá trình phát triển ứng dụng giọng nói truyền thống, đòi hỏi nhiều mô hình để nhận dạng giọng nói, hiểu ngôn ngữ và chuyển văn bản thành giọng nói. Bằng cách hợp nhất các bước này thành một mô hình duy nhất, Nova Sonic bảo toàn ngữ cảnh âm thanh và sắc thái của cuộc trò chuyện, tạo ra các tương tác mượt mà hơn, tự nhiên hơn. Nó cũng cung cấp bản ghi chép văn bản về giọng nói của người dùng, giúp các nhà phát triển dễ dàng tích hợp với các công cụ và API cụ thể.

Về hiệu suất, Nova Sonic đã chứng minh được độ chính xác và chất lượng vượt trội trong việc hiểu và tạo ra giọng nói, vượt qua các chuẩn mực của ngành. Nó đã chứng minh được khả năng đặc biệt trong việc xử lý giọng nói tự nhiên, bao gồm quản lý các khoảng dừng và ngắt quãng trong khi vẫn duy trì được ngữ cảnh hội thoại. Mô hình này cũng cung cấp tỷ lệ lỗi từ thấp trên nhiều ngôn ngữ và phương ngữ, chứng minh được sự mạnh mẽ trong môi trường ồn ào.

Nova Sonic hỗ trợ nhiều giọng nói và phong cách nói bản địa, hiện đang hỗ trợ tiếng Anh Mỹ và Anh, với kế hoạch bổ sung thêm nhiều ngôn ngữ khác trong tương lai. Nó cũng tự hào có tốc độ và hiệu quả về chi phí hàng đầu trong ngành, cung cấp latency thấp hơn và giá thấp hơn so với các mẫu tương tự trên thị trường.

Mô hình này đã nhận được phản hồi tích cực từ các công ty như ASAP và Education First, những công ty này ca ngợi khả năng hiểu giọng nói chính xác và tính tương tác của nó trong việc cải thiện dịch vụ khách hàng và trải nghiệm giáo dục. Stats Perform cũng ghi nhận latency thấp và lời nhắc trực quan của Nova Sonic giúp họ đưa ra phản hồi tức thì và trải nghiệm người dùng liền mạch trong các ứng dụng công nghệ AI và dữ liệu thể thao của họ.

Chia sẻ bài viết này:

Tin tức mới nhất
Ba công ty phát triển nền tảng RAG phân tán an toàn.

Ba công ty phát triển nền tảng RAG phân tán an toàn.

0:00 12/5/26

Aegis Application, ZenmuTech và Technica AI đã công bố hợp tác phát triển giải pháp “chia sẻ bí mật × RAG” an toàn

Surgecraft ra mắt nền tảng hỗ trợ TuneAIBot.

Surgecraft ra mắt nền tảng hỗ trợ TuneAIBot.

0:00 12/5/26

Surgecraft vừa công bố ra mắt “TuneAIBot”, một nền tảng trí tuệ nhân tạo hỗ trợ khách hàng được thiết kế để quản lý các yêu cầu trên LINE, email, trò chuyện trực tuyến

PKSHA Infinity bổ sung tính năng trò chuyện AI vào YOMEL.

PKSHA Infinity bổ sung tính năng trò chuyện AI vào YOMEL.

0:00 12/5/26

PKSHA Infinity vừa công bố ra mắt chức năng trò chuyện AI mới cho nền tảng ghi chép cuộc họp “YOMEL”.

FID ra mắt nền tảng hiển thị thông tin AI Genview.

FID ra mắt nền tảng hiển thị thông tin AI Genview.

0:00 12/5/26

FID vừa công bố ra mắt “Genview”, một nền tảng tối ưu hóa tìm kiếm dựa trên trí tuệ nhân tạo (AI) được thiết kế để đo lường mức độ đề xuất thương hiệu trên các dịch vụ AI

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Ba công ty phát triển nền tảng RAG phân tán an toàn.

Ba công ty phát triển nền tảng RAG phân tán an toàn.

0:00 12/5/26

Aegis Application, ZenmuTech và Technica AI đã công bố hợp tác phát triển giải pháp “chia sẻ bí mật × RAG” an toàn

Surgecraft ra mắt nền tảng hỗ trợ TuneAIBot.

Surgecraft ra mắt nền tảng hỗ trợ TuneAIBot.

0:00 12/5/26

Surgecraft vừa công bố ra mắt “TuneAIBot”, một nền tảng trí tuệ nhân tạo hỗ trợ khách hàng được thiết kế để quản lý các yêu cầu trên LINE, email, trò chuyện trực tuyến

PKSHA Infinity bổ sung tính năng trò chuyện AI vào YOMEL.

PKSHA Infinity bổ sung tính năng trò chuyện AI vào YOMEL.

0:00 12/5/26

PKSHA Infinity vừa công bố ra mắt chức năng trò chuyện AI mới cho nền tảng ghi chép cuộc họp “YOMEL”.

FID ra mắt nền tảng hiển thị thông tin AI Genview.

FID ra mắt nền tảng hiển thị thông tin AI Genview.

0:00 12/5/26

FID vừa công bố ra mắt “Genview”, một nền tảng tối ưu hóa tìm kiếm dựa trên trí tuệ nhân tạo (AI) được thiết kế để đo lường mức độ đề xuất thương hiệu trên các dịch vụ AI

bottom of page