top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Google AI Studio ra mắt mô hình Gemini 2.5 nâng cao

Generatived

5:00 8/10/25

Google AI Studio đã công bố phát hành mô hình Sử dụng Máy tính Gemini 2.5, một mô hình mới được xây dựng chuyên biệt giúp nâng cao khả năng tương tác của các tác nhân với giao diện người dùng. Dựa trên khả năng hiểu và lập luận trực quan của Gemini 2.5 Pro, mô hình này được thiết kế để vượt trội hơn các giải pháp thay thế hiện có trong các tác vụ điều khiển trên web và thiết bị di động, đồng thời duy trì latency thấp. Các nhà phát triển giờ đây có thể tích hợp các tính năng tiên tiến này vào ứng dụng của mình thông qua API Gemini, có sẵn trong Google AI Studio và Vertex AI.

Mô hình mới này giải quyết thách thức tự động hóa các tác vụ đòi hỏi tương tác trực tiếp với giao diện người dùng đồ họa, chẳng hạn như điền biểu mẫu hoặc điều hướng trang web hoặc ứng dụng. Bằng cách cho phép các tác nhân thực hiện các hành động như nhấp chuột, nhập liệu và cuộn, mô hình mô phỏng tương tác của con người với môi trường kỹ thuật số. Sự tiến bộ này đặc biệt quan trọng đối với các tác vụ liên quan đến việc thao tác các yếu tố tương tác hoặc hoạt động ẩn khi đã đăng nhập, và đánh dấu một bước tiến quan trọng trong quá trình phát triển các tác nhân đa năng, đa năng.

Mô hình sử dụng máy tính Gemini 2.5 hoạt động theo vòng lặp sử dụng công cụ `computer_use` trong API Gemini. Nó xử lý các yêu cầu, ảnh chụp màn hình và lịch sử hành động của người dùng, đồng thời tạo ra các phản hồi hành động UI phù hợp. Các phản hồi này có thể bao gồm các lệnh gọi hàm cho các hành động như nhấp chuột và nhập liệu, và cũng có thể nhắc người dùng xác nhận cho một số hành động nhất định. Hiệu suất của mô hình đã được xác thực qua nhiều tiêu chuẩn khác nhau, chứng minh tính hiệu quả của nó đối với các tác vụ điều khiển UI trên trình duyệt và thiết bị di động, nhưng vẫn chưa được tối ưu hóa cho việc điều khiển ở cấp độ hệ điều hành máy tính để bàn.

Google AI Studio nhấn mạnh tầm quan trọng của tính an toàn đối với các tác nhân AI điều khiển máy tính và nhận thức được những rủi ro tiềm ẩn của việc sử dụng sai mục đích, hành vi bất ngờ và gian lận trên web. Để giảm thiểu những rủi ro này, mô hình được tích hợp các tính năng an toàn và cung cấp cho các nhà phát triển các biện pháp bảo vệ để ngăn chặn các hành động rủi ro cao được thực hiện. Các nhà phát triển được khuyến khích kiểm tra kỹ lưỡng hệ thống của mình và tuân thủ các phương pháp hay nhất được nêu trong tài liệu. Mô hình điều khiển bằng máy tính Gemini 2.5 hiện đang trong giai đoạn xem trước công khai, và Google AI Studio hoan nghênh các nhà phát triển dùng thử mô hình và cung cấp phản hồi về nó trong quá trình phát triển.

Chia sẻ bài viết này:

Tin tức mới nhất
OpenAI giới thiệu các tác nhân không gian làm việc nhằm nâng cao năng suất nhóm.

OpenAI giới thiệu các tác nhân không gian làm việc nhằm nâng cao năng suất nhóm.

0:00 24/4/26

Theo các nguồn tin, OpenAI sẽ giới thiệu các tác nhân không gian làm việc trong ChatGPT, cho phép các nhóm tạo ra các tác nhân AI dùng chung để quản lý các quy trình làm

OpenAI ra mắt ChatGPT cho các bác sĩ lâm sàng, cung cấp quyền truy cập miễn phí.

OpenAI ra mắt ChatGPT cho các bác sĩ lâm sàng, cung cấp quyền truy cập miễn phí.

0:00 24/4/26

Theo các báo cáo, OpenAI đã ra mắt ChatGPT dành cho các bác sĩ lâm sàng, cung cấp quyền truy cập miễn phí vào các chuyên gia chăm sóc sức khỏe đã được xác minh tại

Salary Up Lab ra mắt giải pháp đánh giá nhân sự bằng AI.

Salary Up Lab ra mắt giải pháp đánh giá nhân sự bằng AI.

0:00 24/4/26

Salary Up Lab vừa công bố ra mắt dịch vụ đánh giá nhân sự dựa trên trí tuệ nhân tạo, được thiết kế để hỗ trợ các công ty từ khâu thiết kế hệ thống đến vận hành và cải tiến liên tục.

Hệ thống Heptagon AI Minutes giúp giảm thời gian làm việc.

Hệ thống Heptagon AI Minutes giúp giảm thời gian làm việc.

0:00 24/4/26

Theo các nguồn tin, Heptagon đã hỗ trợ một đài truyền hình khu vực triển khai hệ thống trí tuệ nhân tạo tạo sinh để ghi chép biên bản cuộc họp

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
OpenAI giới thiệu các tác nhân không gian làm việc nhằm nâng cao năng suất nhóm.

OpenAI giới thiệu các tác nhân không gian làm việc nhằm nâng cao năng suất nhóm.

0:00 24/4/26

Theo các nguồn tin, OpenAI sẽ giới thiệu các tác nhân không gian làm việc trong ChatGPT, cho phép các nhóm tạo ra các tác nhân AI dùng chung để quản lý các quy trình làm

OpenAI ra mắt ChatGPT cho các bác sĩ lâm sàng, cung cấp quyền truy cập miễn phí.

OpenAI ra mắt ChatGPT cho các bác sĩ lâm sàng, cung cấp quyền truy cập miễn phí.

0:00 24/4/26

Theo các báo cáo, OpenAI đã ra mắt ChatGPT dành cho các bác sĩ lâm sàng, cung cấp quyền truy cập miễn phí vào các chuyên gia chăm sóc sức khỏe đã được xác minh tại

Salary Up Lab ra mắt giải pháp đánh giá nhân sự bằng AI.

Salary Up Lab ra mắt giải pháp đánh giá nhân sự bằng AI.

0:00 24/4/26

Salary Up Lab vừa công bố ra mắt dịch vụ đánh giá nhân sự dựa trên trí tuệ nhân tạo, được thiết kế để hỗ trợ các công ty từ khâu thiết kế hệ thống đến vận hành và cải tiến liên tục.

Hệ thống Heptagon AI Minutes giúp giảm thời gian làm việc.

Hệ thống Heptagon AI Minutes giúp giảm thời gian làm việc.

0:00 24/4/26

Theo các nguồn tin, Heptagon đã hỗ trợ một đài truyền hình khu vực triển khai hệ thống trí tuệ nhân tạo tạo sinh để ghi chép biên bản cuộc họp

bottom of page