top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Amazon công bố Nova Sonic AI để tăng cường tương tác bằng giọng nói

Generatived

0:00 10/4/25

Amazon Inc. đã công bố một mô hình AI mới, Amazon Nova Sonic, kết hợp khả năng hiểu giọng nói và tạo giọng nói thành một nền tảng duy nhất. Sáng kiến ​​này nhằm mục đích tăng cường tương tác bằng giọng nói trong các ứng dụng AI, khiến chúng trở nên tự nhiên và giống con người hơn. Mô hình này có thể truy cập thông qua Amazon Bedrock và API phát trực tuyến hai chiều của nó, hợp lý hóa quá trình phát triển các ứng dụng giọng nói trong nhiều lĩnh vực, bao gồm du lịch, chăm sóc sức khỏe và giáo dục.

Rohit Prasad, Phó chủ tịch cấp cao của Amazon AI (Trí tuệ nhân tạo), nhấn mạnh rằng Amazon luôn đi đầu trong công nghệ giọng nói, từ Alexa đến AWS service . Nova Sonic là bước tiến lớn trong việc đơn giản hóa quy trình phát triển cho các ứng dụng nhận dạng giọng nói và cải thiện độ chính xác cũng như sự tương tác của người dùng.

Nova Sonic giải quyết sự phức tạp của quá trình phát triển ứng dụng giọng nói truyền thống, đòi hỏi nhiều mô hình để nhận dạng giọng nói, hiểu ngôn ngữ và chuyển văn bản thành giọng nói. Bằng cách hợp nhất các bước này thành một mô hình duy nhất, Nova Sonic bảo toàn ngữ cảnh âm thanh và sắc thái của cuộc trò chuyện, tạo ra các tương tác mượt mà hơn, tự nhiên hơn. Nó cũng cung cấp bản ghi chép văn bản về giọng nói của người dùng, giúp các nhà phát triển dễ dàng tích hợp với các công cụ và API cụ thể.

Về hiệu suất, Nova Sonic đã chứng minh được độ chính xác và chất lượng vượt trội trong việc hiểu và tạo ra giọng nói, vượt qua các chuẩn mực của ngành. Nó đã chứng minh được khả năng đặc biệt trong việc xử lý giọng nói tự nhiên, bao gồm quản lý các khoảng dừng và ngắt quãng trong khi vẫn duy trì được ngữ cảnh hội thoại. Mô hình này cũng cung cấp tỷ lệ lỗi từ thấp trên nhiều ngôn ngữ và phương ngữ, chứng minh được sự mạnh mẽ trong môi trường ồn ào.

Nova Sonic hỗ trợ nhiều giọng nói và phong cách nói bản địa, hiện đang hỗ trợ tiếng Anh Mỹ và Anh, với kế hoạch bổ sung thêm nhiều ngôn ngữ khác trong tương lai. Nó cũng tự hào có tốc độ và hiệu quả về chi phí hàng đầu trong ngành, cung cấp latency thấp hơn và giá thấp hơn so với các mẫu tương tự trên thị trường.

Mô hình này đã nhận được phản hồi tích cực từ các công ty như ASAP và Education First, những công ty này ca ngợi khả năng hiểu giọng nói chính xác và tính tương tác của nó trong việc cải thiện dịch vụ khách hàng và trải nghiệm giáo dục. Stats Perform cũng ghi nhận latency thấp và lời nhắc trực quan của Nova Sonic giúp họ đưa ra phản hồi tức thì và trải nghiệm người dùng liền mạch trong các ứng dụng công nghệ AI và dữ liệu thể thao của họ.

Chia sẻ bài viết này:

Tin tức mới nhất
AnyReach ra mắt nền tảng tối ưu hóa tìm kiếm bằng AI.

AnyReach ra mắt nền tảng tối ưu hóa tìm kiếm bằng AI.

0:00 15/5/26

AnyReach vừa công bố ra mắt “AnyLLMO”, một nền tảng cơ sở hạ tầng tập trung vào tối ưu hóa mô hình ngôn ngữ quy mô lớn cho môi trường tìm kiếm được hỗ trợ bởi trí tuệ nhân tạo.

Imacrea ra mắt gói AI cho Chuo

Imacrea ra mắt gói AI cho Chuo

0:00 15/5/26

Imacrea đã thông báo ra mắt gói vận hành “exaBase Generative AI for Municipalities” tại thành phố Chuo, Tokyo

Bajji ra mắt dịch vụ hệ thống AI gốc.

Bajji ra mắt dịch vụ hệ thống AI gốc.

0:00 15/5/26

Bajji vừa công bố ra mắt “PontWorks”, một dịch vụ phát triển hệ thống dựa trên trí tuệ nhân tạo (AI) theo hình thức đăng ký thuê bao dành cho các doanh nghiệp vừa và nhỏ.

GVA TECH hợp nhất các dịch vụ AI pháp lý.

GVA TECH hợp nhất các dịch vụ AI pháp lý.

0:00 15/5/26

GVA TECH thông báo rằng các dịch vụ AI tập trung vào luật sư của họ sẽ được hợp nhất dưới thương hiệu mới “Benpal”.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
AnyReach ra mắt nền tảng tối ưu hóa tìm kiếm bằng AI.

AnyReach ra mắt nền tảng tối ưu hóa tìm kiếm bằng AI.

0:00 15/5/26

AnyReach vừa công bố ra mắt “AnyLLMO”, một nền tảng cơ sở hạ tầng tập trung vào tối ưu hóa mô hình ngôn ngữ quy mô lớn cho môi trường tìm kiếm được hỗ trợ bởi trí tuệ nhân tạo.

Imacrea ra mắt gói AI cho Chuo

Imacrea ra mắt gói AI cho Chuo

0:00 15/5/26

Imacrea đã thông báo ra mắt gói vận hành “exaBase Generative AI for Municipalities” tại thành phố Chuo, Tokyo

Bajji ra mắt dịch vụ hệ thống AI gốc.

Bajji ra mắt dịch vụ hệ thống AI gốc.

0:00 15/5/26

Bajji vừa công bố ra mắt “PontWorks”, một dịch vụ phát triển hệ thống dựa trên trí tuệ nhân tạo (AI) theo hình thức đăng ký thuê bao dành cho các doanh nghiệp vừa và nhỏ.

GVA TECH hợp nhất các dịch vụ AI pháp lý.

GVA TECH hợp nhất các dịch vụ AI pháp lý.

0:00 15/5/26

GVA TECH thông báo rằng các dịch vụ AI tập trung vào luật sư của họ sẽ được hợp nhất dưới thương hiệu mới “Benpal”.

bottom of page