top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Azure AI phát hành bản xem trước công khai của hình đại diện bằng giọng nói

Generatived

10:50 17/11/23

Azure AI đã phát hành bản xem trước công khai về tính năng mới, hình đại diện chuyển văn bản thành giọng nói. Công cụ cải tiến này cho phép người dùng tạo video hình đại diện biết nói bằng cách nhập văn bản hoặc phát triển các bot tương tác thời gian thực bằng hình ảnh con người. Hệ thống hình đại diện chuyển văn bản thành giọng nói là hệ thống chuyển văn bản thành giọng nói với khả năng thị giác cho phép khách hàng tạo video tổng hợp với hình đại diện nói chuyện như ảnh chụp 2D. Mô hình hình đại diện được đào tạo bởi mạng lưới thần kinh sâu dựa trên các mẫu ghi video của con người và giọng nói của hình đại diện được cung cấp bởi mô hình giọng nói chuyển văn bản thành giọng nói.

Tạo hình đại diện có hai mục đích chính. Đầu tiên, việc sản xuất nội dung video thông thường đòi hỏi nhiều thời gian và ngân sách, bao gồm việc chuẩn bị môi trường quay video, quay và chỉnh sửa video. Hình đại diện chuyển văn bản thành giọng nói cho phép người dùng tạo nội dung video hiệu quả hơn, chẳng hạn như video đào tạo, giới thiệu sản phẩm và lời chứng thực của khách hàng, chỉ bằng cách nhập văn bản. Thứ hai, với việc phát hành Dịch vụ Azure OpenAI và chuyển văn bản thần kinh thành giọng nói, các cuộc hội thoại tương tác giờ đây trở nên tự nhiên hơn bao giờ hết. Hình đại diện chuyển văn bản thành giọng nói cho phép người dùng tạo các tương tác kỹ thuật số hấp dẫn hơn và xây dựng các tác nhân đàm thoại, trợ lý ảo, chatbot, v.v.

Quy trình tạo nội dung hình đại diện bao gồm ba thành phần: bộ phân tích văn bản, bộ tổng hợp âm thanh TTS và bộ tổng hợp video hình đại diện TTS. Để tạo video hình đại diện, trước tiên văn bản phải được nhập vào bộ phân tích văn bản, bộ phân tích này cung cấp đầu ra dưới dạng chuỗi âm vị. Tiếp theo, bộ tổng hợp âm thanh TTS dự đoán các đặc điểm âm thanh của văn bản đầu vào và tổng hợp âm thanh. Hai phần này được cung cấp bởi mô hình giọng nói chuyển văn bản thành giọng nói. Tiếp theo, mô hình Avatar chuyển văn bản thành giọng nói thần kinh sử dụng các tính năng âm thanh để dự đoán hình ảnh hát nhép và tạo ra video tổng hợp.

Azure AI hiện cung cấp hai khả năng hình đại diện chuyển văn bản thành giọng nói riêng biệt: hình đại diện văn bản thành giọng nói dựng sẵn và hình đại diện văn bản thành giọng nói tùy chỉnh. Hình đại diện dựng sẵn có thể nói các ngôn ngữ và giọng nói khác nhau dựa trên cách nhập văn bản. Khách hàng có thể chọn hình đại diện từ nhiều tùy chọn khác nhau và sử dụng chúng để tạo nội dung video và ứng dụng tương tác với phản hồi hình đại diện theo thời gian thực. Tính năng hình đại diện chuyển văn bản thành giọng nói tùy chỉnh cho phép khách hàng tạo hình đại diện được cá nhân hóa cho sản phẩm hoặc thương hiệu của họ. Khách hàng có thể tải lên các bản ghi video của riêng họ về các tài năng avatar mà công ty cho biết sẽ được sử dụng để đào tạo các video tổng hợp về cách phát biểu của các avatar tùy chỉnh. nước xốt:

Chia sẻ bài viết này:

Tin tức mới nhất
Dịch vụ chẩn đoán AI t�ại khu vực bán hàng của Scope và Polaris.AI.

Dịch vụ chẩn đoán AI tại khu vực bán hàng của Scope và Polaris.AI.

0:00 19/2/26

Scope (Chiyoda-ku, Tokyo) và Polaris.AI (Bunkyo-ku, Tokyo) đã phát triển "SCOPY," một dịch vụ chẩn đoán không gian bán hàng dựa trên trí tuệ nhân tạo (AI).

Chương trình hỗ trợ khởi nghiệp AI của Bright Data

Chương trình hỗ trợ khởi nghiệp AI của Bright Data

0:00 19/2/26

Bright Data (không nêu rõ địa điểm trụ sở chính) đã ra mắt một chương trình mới dành cho các công ty khởi nghiệp về trí tuệ nhân tạo

Tác động và chiến lược của quảng cáo GPT trên W2Chat

Tác động và chiến lược của quảng cáo GPT trên W2Chat

0:00 19/2/26

Đài W2 (Quận Chuo, Tokyo) sẽ phát sóng trực tiếp chương trình trên nền tảng video "Commerce Hack"

Sự tiến hóa công khai của thuật toán AI Congzi

Sự tiến hóa công khai của thuật toán AI Congzi

0:00 19/2/26

Công ty Congzi (Trung Quốc) đã mở ra những chân trời mới trong công nghệ trí tuệ nhân tạo (AI).

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Dịch vụ chẩn đoán AI tại khu vực bán hàng của Scope và Polaris.AI.

Dịch vụ chẩn đoán AI tại khu vực bán hàng của Scope và Polaris.AI.

0:00 19/2/26

Scope (Chiyoda-ku, Tokyo) và Polaris.AI (Bunkyo-ku, Tokyo) đã phát triển "SCOPY," một dịch vụ chẩn đoán không gian bán hàng dựa trên trí tuệ nhân tạo (AI).

Chương trình hỗ trợ khởi nghiệp AI của Bright Data

Chương trình hỗ trợ khởi nghiệp AI của Bright Data

0:00 19/2/26

Bright Data (không nêu rõ địa điểm trụ sở chính) đã ra mắt một chương trình mới dành cho các công ty khởi nghiệp về trí tuệ nhân tạo

Tác động và chiến lược của quảng cáo GPT trên W2Chat

Tác động và chiến lược của quảng cáo GPT trên W2Chat

0:00 19/2/26

Đài W2 (Quận Chuo, Tokyo) sẽ phát sóng trực tiếp chương trình trên nền tảng video "Commerce Hack"

Sự tiến hóa công khai của thuật toán AI Congzi

Sự tiến hóa công khai của thuật toán AI Congzi

0:00 19/2/26

Công ty Congzi (Trung Quốc) đã mở ra những chân trời mới trong công nghệ trí tuệ nhân tạo (AI).

bottom of page