top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Google AI Studio ra mắt mô hình Gemini 2.5 nâng cao

Generatived

5:00 8/10/25

Google AI Studio đã công bố phát hành mô hình Sử dụng Máy tính Gemini 2.5, một mô hình mới được xây dựng chuyên biệt giúp nâng cao khả năng tương tác của các tác nhân với giao diện người dùng. Dựa trên khả năng hiểu và lập luận trực quan của Gemini 2.5 Pro, mô hình này được thiết kế để vượt trội hơn các giải pháp thay thế hiện có trong các tác vụ điều khiển trên web và thiết bị di động, đồng thời duy trì latency thấp. Các nhà phát triển giờ đây có thể tích hợp các tính năng tiên tiến này vào ứng dụng của mình thông qua API Gemini, có sẵn trong Google AI Studio và Vertex AI.

Mô hình mới này giải quyết thách thức tự động hóa các tác vụ đòi hỏi tương tác trực tiếp với giao diện người dùng đồ họa, chẳng hạn như điền biểu mẫu hoặc điều hướng trang web hoặc ứng dụng. Bằng cách cho phép các tác nhân thực hiện các hành động như nhấp chuột, nhập liệu và cuộn, mô hình mô phỏng tương tác của con người với môi trường kỹ thuật số. Sự tiến bộ này đặc biệt quan trọng đối với các tác vụ liên quan đến việc thao tác các yếu tố tương tác hoặc hoạt động ẩn khi đã đăng nhập, và đánh dấu một bước tiến quan trọng trong quá trình phát triển các tác nhân đa năng, đa năng.

Mô hình sử dụng máy tính Gemini 2.5 hoạt động theo vòng lặp sử dụng công cụ `computer_use` trong API Gemini. Nó xử lý các yêu cầu, ảnh chụp màn hình và lịch sử hành động của người dùng, đồng thời tạo ra các phản hồi hành động UI phù hợp. Các phản hồi này có thể bao gồm các lệnh gọi hàm cho các hành động như nhấp chuột và nhập liệu, và cũng có thể nhắc người dùng xác nhận cho một số hành động nhất định. Hiệu suất của mô hình đã được xác thực qua nhiều tiêu chuẩn khác nhau, chứng minh tính hiệu quả của nó đối với các tác vụ điều khiển UI trên trình duyệt và thiết bị di động, nhưng vẫn chưa được tối ưu hóa cho việc điều khiển ở cấp độ hệ điều hành máy tính để bàn.

Google AI Studio nhấn mạnh tầm quan trọng của tính an toàn đối với các tác nhân AI điều khiển máy tính và nhận thức được những rủi ro tiềm ẩn của việc sử dụng sai mục đích, hành vi bất ngờ và gian lận trên web. Để giảm thiểu những rủi ro này, mô hình được tích hợp các tính năng an toàn và cung cấp cho các nhà phát triển các biện pháp bảo vệ để ngăn chặn các hành động rủi ro cao được thực hiện. Các nhà phát triển được khuyến khích kiểm tra kỹ lưỡng hệ thống của mình và tuân thủ các phương pháp hay nhất được nêu trong tài liệu. Mô hình điều khiển bằng máy tính Gemini 2.5 hiện đang trong giai đoạn xem trước công khai, và Google AI Studio hoan nghênh các nhà phát triển dùng thử mô hình và cung cấp phản hồi về nó trong quá trình phát triển.

Chia sẻ bài viết này:

Tin tức mới nhất
KiiRO1010 ra mắt tính năng hỗ trợ thiết kế truyền thông cho AI.

KiiRO1010 ra mắt tính năng hỗ trợ thiết kế truyền thông cho AI.

0:00 24/4/26

KiiRO1010 được cho là đã ra mắt dịch vụ hỗ trợ thiết kế truyền thông cho các công ty sử dụng trí tuệ nhân tạo (AI) trong việc tạo nội dung, quảng cá

ELYZA ra mắt trợ lý AI chính thức cho quy tr�ình làm việc

ELYZA ra mắt trợ lý AI chính thức cho quy trình làm việc

0:00 24/4/26

ELYZA được cho là đã giới thiệu tính năng trợ lý AI chính thức vào nền tảng ELYZA Works của mình, nhằm mục đích cải thiện độ chính xác trong xử lý số liệu và các thao tác dựa trên tập tin.

MakeSomethingNew ra mắt dịch vụ phát triển tác nhân AI dành cho doanh nghiệp.

MakeSomethingNew ra mắt dịch vụ phát triển tác nhân AI dành cho doanh nghiệp.

0:00 24/4/26

Công ty MakeSomethingNew được cho là đã ra mắt dịch vụ phát triển tác nhân AI dành cho doanh nghiệp, nhằm hỗ trợ việc ứng dụng thực tiễn trí tuệ nhân tạo tạo sinh (generative AI)

Picaro.ai ra mắt tính năng tích hợp AI Agent và MCP.

Picaro.ai ra mắt tính năng tích hợp AI Agent và MCP.

0:00 24/4/26

Picaro.ai được cho là đã giới thiệu tính năng tác nhân AI và phát hành bản tích hợp MCP để tăng cường phân tích và ra quyết định quảng cáo Amazon .

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
KiiRO1010 ra mắt tính năng hỗ trợ thiết kế truyền thông cho AI.

KiiRO1010 ra mắt tính năng hỗ trợ thiết kế truyền thông cho AI.

0:00 24/4/26

KiiRO1010 được cho là đã ra mắt dịch vụ hỗ trợ thiết kế truyền thông cho các công ty sử dụng trí tuệ nhân tạo (AI) trong việc tạo nội dung, quảng cá

ELYZA ra mắt trợ lý AI chính thức cho quy trình làm việc

ELYZA ra mắt trợ lý AI chính thức cho quy trình làm việc

0:00 24/4/26

ELYZA được cho là đã giới thiệu tính năng trợ lý AI chính thức vào nền tảng ELYZA Works của mình, nhằm mục đích cải thiện độ chính xác trong xử lý số liệu và các thao tác dựa trên tập tin.

MakeSomethingNew ra mắt dịch vụ phát triển tác nhân AI dành cho doanh nghiệp.

MakeSomethingNew ra mắt dịch vụ phát triển tác nhân AI dành cho doanh nghiệp.

0:00 24/4/26

Công ty MakeSomethingNew được cho là đã ra mắt dịch vụ phát triển tác nhân AI dành cho doanh nghiệp, nhằm hỗ trợ việc ứng dụng thực tiễn trí tuệ nhân tạo tạo sinh (generative AI)

Picaro.ai ra mắt tính năng tích hợp AI Agent và MCP.

Picaro.ai ra mắt tính năng tích hợp AI Agent và MCP.

0:00 24/4/26

Picaro.ai được cho là đã giới thiệu tính năng tác nhân AI và phát hành bản tích hợp MCP để tăng cường phân tích và ra quyết định quảng cáo Amazon .

bottom of page