top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Azure AI phát hành bản xem trước công khai của hình đại diện bằng giọng nói

Generatived

10:50 17/11/23

Azure AI đã phát hành bản xem trước công khai về tính năng mới, hình đại diện chuyển văn bản thành giọng nói. Công cụ cải tiến này cho phép người dùng tạo video hình đại diện biết nói bằng cách nhập văn bản hoặc phát triển các bot tương tác thời gian thực bằng hình ảnh con người. Hệ thống hình đại diện chuyển văn bản thành giọng nói là hệ thống chuyển văn bản thành giọng nói với khả năng thị giác cho phép khách hàng tạo video tổng hợp với hình đại diện nói chuyện như ảnh chụp 2D. Mô hình hình đại diện được đào tạo bởi mạng lưới thần kinh sâu dựa trên các mẫu ghi video của con người và giọng nói của hình đại diện được cung cấp bởi mô hình giọng nói chuyển văn bản thành giọng nói.

Tạo hình đại diện có hai mục đích chính. Đầu tiên, việc sản xuất nội dung video thông thường đòi hỏi nhiều thời gian và ngân sách, bao gồm việc chuẩn bị môi trường quay video, quay và chỉnh sửa video. Hình đại diện chuyển văn bản thành giọng nói cho phép người dùng tạo nội dung video hiệu quả hơn, chẳng hạn như video đào tạo, giới thiệu sản phẩm và lời chứng thực của khách hàng, chỉ bằng cách nhập văn bản. Thứ hai, với việc phát hành Dịch vụ Azure OpenAI và chuyển văn bản thần kinh thành giọng nói, các cuộc hội thoại tương tác giờ đây trở nên tự nhiên hơn bao giờ hết. Hình đại diện chuyển văn bản thành giọng nói cho phép người dùng tạo các tương tác kỹ thuật số hấp dẫn hơn và xây dựng các tác nhân đàm thoại, trợ lý ảo, chatbot, v.v.

Quy trình tạo nội dung hình đại diện bao gồm ba thành phần: bộ phân tích văn bản, bộ tổng hợp âm thanh TTS và bộ tổng hợp video hình đại diện TTS. Để tạo video hình đại diện, trước tiên văn bản phải được nhập vào bộ phân tích văn bản, bộ phân tích này cung cấp đầu ra dưới dạng chuỗi âm vị. Tiếp theo, bộ tổng hợp âm thanh TTS dự đoán các đặc điểm âm thanh của văn bản đầu vào và tổng hợp âm thanh. Hai phần này được cung cấp bởi mô hình giọng nói chuyển văn bản thành giọng nói. Tiếp theo, mô hình Avatar chuyển văn bản thành giọng nói thần kinh sử dụng các tính năng âm thanh để dự đoán hình ảnh hát nhép và tạo ra video tổng hợp.

Azure AI hiện cung cấp hai khả năng hình đại diện chuyển văn bản thành giọng nói riêng biệt: hình đại diện văn bản thành giọng nói dựng sẵn và hình đại diện văn bản thành giọng nói tùy chỉnh. Hình đại diện dựng sẵn có thể nói các ngôn ngữ và giọng nói khác nhau dựa trên cách nhập văn bản. Khách hàng có thể chọn hình đại diện từ nhiều tùy chọn khác nhau và sử dụng chúng để tạo nội dung video và ứng dụng tương tác với phản hồi hình đại diện theo thời gian thực. Tính năng hình đại diện chuyển văn bản thành giọng nói tùy chỉnh cho phép khách hàng tạo hình đại diện được cá nhân hóa cho sản phẩm hoặc thương hiệu của họ. Khách hàng có thể tải lên các bản ghi video của riêng họ về các tài năng avatar mà công ty cho biết sẽ được sử dụng để đào tạo các video tổng hợp về cách phát biểu của các avatar tùy chỉnh. nước xốt:

Chia sẻ bài viết này:

Tin tức mới nhất
Chương trình huấn luyện tự huấn luyện bằng AI của Coaching4U bắt đầu.

Chương trình huấn luyện tự huấn luyện bằng AI của Coaching4U bắt đầu.

0:00 4/2/26

Công ty Coaching4U LLC (Tokyo) đã ra mắt chương trình "Đào tạo tự huấn luyện bằng AI". Chương trình thực tiễn này giải quyết những thách thức của các

Hỗ trợ phát triển AI nội bộ của Viện Nghiên cứu và Logic EN

Hỗ trợ phát triển AI nội bộ của Viện Nghiên cứu và Logic EN

0:00 4/2/26

EN Logical (Thành phố Kyoto) và Viện Nghiên cứu NoCode (Tỉnh Kyoto) đã cho ra mắt một gói dịch vụ mới cho phép các công ty xây dựng và vận hành các trợ lý AI của riêng mình.

Đã thêm các bài thuyết trình TED Talks vào Globee English Learning.

Đã thêm các bài thuyết trình TED Talks vào Globee English Learning.

0:00 4/2/26

Globee (Minato-ku, Tokyo) đã bổ sung 34 bài diễn thuyết TED Talk nổi tiếng vào ứng dụng học tiếng Anh hỗ trợ trí tuệ nhân tạo (AI) của mình, abceed.

Kết quả tối ưu hóa kho hàng bằng AI của Esmat đã được công bố.

Kết quả tối ưu hóa kho hàng bằng AI của Esmat đã được công bố.

0:00 4/2/26

Công ty S-Mat (quận Shinagawa, Tokyo) đã thử nghiệm hoạt động thực tế của việc tối ưu hóa tồn kho bằng cách sử dụng tác nhân AI với dịch vụ quản lý tồn kho

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Chương trình huấn luyện tự huấn luyện bằng AI của Coaching4U bắt đầu.

Chương trình huấn luyện tự huấn luyện bằng AI của Coaching4U bắt đầu.

0:00 4/2/26

Công ty Coaching4U LLC (Tokyo) đã ra mắt chương trình "Đào tạo tự huấn luyện bằng AI". Chương trình thực tiễn này giải quyết những thách thức của các

Hỗ trợ phát triển AI nội bộ của Viện Nghiên cứu và Logic EN

Hỗ trợ phát triển AI nội bộ của Viện Nghiên cứu và Logic EN

0:00 4/2/26

EN Logical (Thành phố Kyoto) và Viện Nghiên cứu NoCode (Tỉnh Kyoto) đã cho ra mắt một gói dịch vụ mới cho phép các công ty xây dựng và vận hành các trợ lý AI của riêng mình.

Đã thêm các bài thuyết trình TED Talks vào Globee English Learning.

Đã thêm các bài thuyết trình TED Talks vào Globee English Learning.

0:00 4/2/26

Globee (Minato-ku, Tokyo) đã bổ sung 34 bài diễn thuyết TED Talk nổi tiếng vào ứng dụng học tiếng Anh hỗ trợ trí tuệ nhân tạo (AI) của mình, abceed.

Kết quả tối ưu hóa kho hàng bằng AI của Esmat đã được công bố.

Kết quả tối ưu hóa kho hàng bằng AI của Esmat đã được công bố.

0:00 4/2/26

Công ty S-Mat (quận Shinagawa, Tokyo) đã thử nghiệm hoạt động thực tế của việc tối ưu hóa tồn kho bằng cách sử dụng tác nhân AI với dịch vụ quản lý tồn kho

bottom of page