Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA phát hành hướng dẫn tạo trợ lý giọng nói.
Generatived
0:00 7/1/26
NVIDIA vừa phát hành một hướng dẫn toàn diện về cách tạo ra một trợ lý ảo điều khiển bằng giọng nói sử dụng mô hình Nemotron mới nhất được giới thiệu tại CES 2026. Hướng dẫn này hướng dẫn các nhà phát triển qua quá trình tích hợp nhiều thành phần khác nhau, bao gồm nhận dạng giọng nói, tạo tăng cường tìm kiếm (RAG), bảo mật nội dung và các mô hình suy luận, để xây dựng một trợ lý AI có thể hiểu và phản hồi đầu vào bằng giọng nói một cách an toàn và thông minh.
Hướng dẫn này nhấn mạnh tầm quan trọng của phương pháp đa phương thức kết hợp dữ liệu văn bản và hình ảnh để nâng cao khả năng phản hồi thông tin thực tế của các tác nhân. Nó cũng giới thiệu mô hình nhận dạng giọng nói tự động Nemotron Speech ASR, được tối ưu hóa cho latency cực thấp và cho phép tương tác giọng nói theo thời gian thực. Các tính năng an toàn của tác nhân được kích hoạt bởi mô hình llama-3.1-nemotron-safety-guard-8b-v3, cung cấp khả năng kiểm duyệt nội dung đa ngôn ngữ và phát hiện thông tin nhận dạng cá nhân (PII) theo thời gian thực.
Về khả năng suy luận, hướng dẫn này giới thiệu mô hình Nemotron 3 Nano, có thể xử lý các cửa sổ ngữ cảnh rộng lên đến 1 triệu token, cho phép tác nhân xem xét nhiều thông tin trước khi đưa ra phản hồi. Hướng dẫn cũng đề cập đến việc triển khai tác nhân, nhấn mạnh tính linh hoạt của mã khi chạy trên nhiều môi trường NVIDIA khác nhau, từ GPU cục bộ đến các dịch vụ dựa trên đám mây.
Các nhà phát triển quan tâm đến việc xây dựng trợ lý giọng nói của riêng mình có thể truy cập các hướng dẫn và tài nguyên đi kèm trên GitHub, và NVIDIA khuyến khích cộng đồng tiếp tục tham gia vào các bản cập nhật và thảo luận về mô hình Nemotron thông qua nhiều nền tảng và diễn đàn trực tuyến khác nhau.
Chia sẻ bài viết này:
Tin tức mới nhất
Hợp đồng với công ty cung cấp dịch vụ đối thoại giọng nói AI Works ID
0:00 14/1/26
Works ID (quận Shibuya, Tokyo) đã ký kết thỏa thuận đại lý bán hàng với Hmcomm (quận Minato, Tokyo) cho giải pháp đối thoại giọng nói AI "Terry2".
Hiển thị thông tin công ty công cụ tìm kiếm Habitus AI
0:00 14/1/26
Công ty Habitus (quận Shibuya, Tokyo) sẽ ra mắt "Habitus Logic" vào ngày 10 tháng 1 năm 2026, một dịch vụ cho phép hiển thị thông tin doanh nghiệp chính xác cho các công cụ tìm kiếm AI.
Rosetta ra mắt dịch vụ hỗ trợ AI cho các khách thuê nhà trống.
0:00 14/1/26
Công ty Rosetta (Tokyo) đã ra mắt Metareal Tenant Demand (Metareal TD), một hệ thống trí tuệ nhân tạo (AI) dự đoán nhu cầu thuê mặt bằng thương mại đang bỏ trống.

%20(1).webp)

