Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Gemini ra mắt AI nâng cao với các tính năng âm thanh tiên tiến

Generatived

0:00 17/6/25

Gemini đã công bố Gemini 2.5, phiên bản nâng cao của AI với khả năng tương tác và tạo giọng nói được cải thiện. Bản cập nhật cho phép tương tác giọng nói tự nhiên hơn, theo thời gian thực, cho phép người dùng trò chuyện với AI với latency tối thiểu. AI hiện có thể hiểu và tạo ra giọng nói với khả năng biểu cảm và ngữ điệu tốt hơn, và có thể thích ứng với một số phong cách nhất định, bao gồm cả giọng và tông giọng cụ thể, theo chỉ dẫn của lời nhắc ngôn ngữ tự nhiên.

Các tính năng mới của Gemini 2.5 cũng mở rộng đến tool consolidation, cung cấp cho AI quyền truy cập vào thông tin thời gian thực trong khi trò chuyện. Nó cũng cung cấp nhận thức theo ngữ cảnh của cuộc trò chuyện, cho phép nó xác định tiếng ồn nền không liên quan. Ngoài ra, AI hiện hỗ trợ các tương tác đa ngôn ngữ và phản hồi theo tông điệu cảm xúc của người dùng, cải thiện chất lượng của cuộc đối thoại. Các khả năng lý luận nâng cao cũng đã được tích hợp, cải thiện hiệu suất của AI trong các tác vụ phức tạp.

Trong lĩnh vực chuyển văn bản thành giọng nói (TTS), Gemini 2.5 cung cấp khả năng kiểm soát chưa từng có đối với việc tạo giọng nói, cho phép biểu diễn biểu cảm và năng động. Thông qua các lời nhắc ngôn ngữ tự nhiên, người dùng có thể chỉ định phong cách, giọng điệu và cảm xúc của giọng nói được tạo ra. AI cũng hỗ trợ tạo hội thoại nhiều người nói và hỗ trợ hơn 24 ngôn ngữ, giúp nó hữu ích cho nhiều ứng dụng từ kể chuyện đến lập trình tin tức.

Các cân nhắc về an toàn và đạo đức luôn được đặt lên hàng đầu trong quá trình phát triển khả năng âm thanh của Gemini 2.5. Nhóm đã tiến hành đánh giá rủi ro và an toàn kỹ lưỡng, bao gồm các bài tập của nhóm đỏ, để đảm bảo triển khai có trách nhiệm. Tất cả đầu ra âm thanh đều được nhúng công nghệ đóng dấu mờ để đảm bảo tính minh bạch. Các nhà phát triển có thể truy cập các khả năng âm thanh gốc này thông qua Google AI Studio hoặc Gemini API của Vertex AI. Phiên bản xem trước có sẵn cho cả phiên bản Pro và Flash của Gemini 2.5.

Nguồn: Thông cáo báo chí

Chia sẻ bài viết này:

Tin tức mới nhất

Công nghệ tăng cường trí tuệ nhân tạo đàm thoại Panasonic WisTalk

0:00 18/12/25

Công ty Panasonic Solution Technology (Tokyo) đã nâng cấp chức năng của chatbot AI "WisTalk", được thiết kế cho việc giải đáp thắc mắc nội bộ và khai thác kiến thức.

đọc thêm

Nền tảng phát hiện video giả mạo mới của AI Data

0:00 18/12/25

Công ty AI Data (Minato-ku, Tokyo) đã bắt đầu xây dựng một nền tảng phát hiện mới sử dụng trí tuệ nhân tạo phát hiện video giả mạo "SYNTHETIQ VISION".

đọc thêm

Các tài liệu về Trí tuệ Nhân tạo Vật lý của APTO hiện đã có sẵn.

0:00 18/12/25

APTO (Shibuya-ku, Tokyo) đã bắt đầu cung cấp tài liệu toàn diện về Trí tuệ nhân tạo vật lý.

đọc thêm

Ứng dụng mua sắm chuyên dụng Stellagent ChatGPT

0:00 18/12/25

Stellagent (Yokohama, tỉnh Kanagawa) đã ra mắt "Omise AI", một dịch vụ cho phép các doanh nghiệp thương mại điện tử và nhà bán lẻ mở ứng dụng cửa hàng riêng của họ trên ChatGPT.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Công nghệ tăng cường trí tuệ nhân tạo đàm thoại Panasonic WisTalk

0:00 18/12/25

Công ty Panasonic Solution Technology (Tokyo) đã nâng cấp chức năng của chatbot AI "WisTalk", được thiết kế cho việc giải đáp thắc mắc nội bộ và khai thác kiến thức.

đọc thêm

Nền tảng phát hiện video giả mạo mới của AI Data

0:00 18/12/25

Công ty AI Data (Minato-ku, Tokyo) đã bắt đầu xây dựng một nền tảng phát hiện mới sử dụng trí tuệ nhân tạo phát hiện video giả mạo "SYNTHETIQ VISION".

đọc thêm

Các tài liệu về Trí tuệ Nhân tạo Vật lý của APTO hiện đã có sẵn.

0:00 18/12/25

APTO (Shibuya-ku, Tokyo) đã bắt đầu cung cấp tài liệu toàn diện về Trí tuệ nhân tạo vật lý.

đọc thêm

Ứng dụng mua sắm chuyên dụng Stellagent ChatGPT

0:00 18/12/25

Stellagent (Yokohama, tỉnh Kanagawa) đã ra mắt "Omise AI", một dịch vụ cho phép các doanh nghiệp thương mại điện tử và nhà bán lẻ mở ứng dụng cửa hàng riêng của họ trên ChatGPT.

đọc thêm