Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Google ra mắt Gemini Omni Flash Video AI
Generatived
0:00 27/5/26
Google vừa công bố ra mắt “Gemini Omni”, một mô hình trí tuệ nhân tạo đa phương thức được thiết kế để tạo và chỉnh sửa video từ sự kết hợp của văn bản, hình ảnh, âm thanh và video đầu vào. Công ty cho biết phiên bản đầu tiên, Gemini Omni Flash, đang được triển khai thông qua ứng dụng Gemini, Google Flow và YouTube Shorts.
Theo Google, mô hình này cho phép chỉnh sửa video bằng hội thoại trong khi vẫn duy trì tính liên tục của cảnh, sự nhất quán của nhân vật và hiệu ứng vật lý thực tế qua nhiều lần chỉnh sửa. Người dùng có thể liên tục sửa đổi môi trường, hành động và phong cách hình ảnh bằng các câu lệnh ngôn ngữ tự nhiên.
Công ty cho biết thêm rằng Gemini Omni kết hợp khả năng suy luận của Gemini với công nghệ tạo nội dung đa phương tiện để hỗ trợ kể chuyện trực quan phức tạp, các video giải thích mang tính giáo dục và nội dung điện ảnh được cách điệu hóa. Hệ thống cũng có thể tích hợp các tham chiếu bên ngoài như hình ảnh, mẫu chuyển động và bản nhạc vào một đoạn phim được tạo ra thống nhất.
Google cho biết tất cả video được tạo ra thông qua Omni đều bao gồm hình mờ kỹ thuật số SynthID để xác minh nội dung và đảm bảo tính minh bạch. Công ty dự định mở rộng hỗ trợ Omni sang các định dạng đầu ra khác và phát hành quyền truy cập API cho các nhà phát triển và khách hàng doanh nghiệp trong những tuần tới.
Chia sẻ bài viết này:

%20(1).webp)
%20(1).webp)