top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Gemini ra mắt AI cho các nhiệm vụ hiểu hình ảnh nâng cao

Generatived

0:00 23/7/25

Gemini mang đến một chiều hướng mới cho khả năng hiểu hình ảnh của AI, cho phép nó phân tích các mô tả và mối quan hệ phức tạp trong một hình ảnh. Sự tiến bộ này cho phép AI nhận dạng các đối tượng không chỉ bằng các nhãn đơn giản mà còn bằng các cụm từ phức tạp, chẳng hạn như xác định ""chiếc xe xa nhất"". Sự đổi mới này cải thiện khả năng tương tác của AI với dữ liệu hình ảnh theo cách tinh tế hơn, giống con người hơn.

Khả năng của AI bao gồm hiểu các mối quan hệ đối tượng, logic điều kiện, khái niệm trừu tượng, văn bản trong hình ảnh và nhãn đa ngôn ngữ. Ví dụ, Gemini có thể nhận dạng ""người cầm ô"" và lọc ra ""đồ ăn chay"", thể hiện khả năng xử lý nhiều truy vấn chi tiết. Khả năng này đặc biệt hữu ích cho các tác vụ đòi hỏi khả năng hiểu biết thị giác nâng cao, chẳng hạn như nhận dạng ""bông hoa héo nhất trong bó hoa"" và nhận dạng văn bản trong hình ảnh.

Ứng dụng thực tế của phân đoạn hình ảnh đàm thoại của Gemini rất đa dạng, từ việc tinh giản biên tập nội dung sáng tạo đến tăng cường giám sát compliance an toàn. Các nhà thiết kế giờ đây có thể tương tác với hình ảnh bằng ngôn ngữ tự nhiên, và các nhà quản lý an toàn có thể xác định hành vi không tuân thủ bằng các hướng dẫn như ""làm nổi bật nhân viên không đội mũ bảo hiểm"". Các giám định viên bảo hiểm có thể đánh giá thiệt hại chính xác hơn bằng cách yêu cầu AI ""Segment nhà bị hư hại do thời tiết"". Điều này chứng minh khả năng hiểu các khái niệm trừu tượng của Gemini.

Đối với các nhà phát triển, công nghệ của Gemini là một bước tiến vượt bậc. Nó cung cấp các mô hình ngôn ngữ linh hoạt, không phụ thuộc vào các lớp được xác định trước, cho phép tạo ra các giải pháp tùy chỉnh cho nhiều ngành công nghiệp khác nhau. Ngoài ra, trải nghiệm dành cho nhà phát triển được đơn giản hóa với một API duy nhất cho tất cả các nhu cầu phân khúc, giúp dân chủ hóa quyền truy cập vào các ứng dụng thị giác tiên tiến, cho phép các nhà phát triển dễ dàng tích hợp các khả năng hiểu thị giác tiên tiến vào sản phẩm của họ.

Chia sẻ bài viết này:

Tin tức mới nhất
GenAi AI Agent hiện đã có sẵn.

GenAi AI Agent hiện đã có sẵn.

0:00 11/2/26

Công ty GenAi (Shibuya-ku, Tokyo) thông báo sẽ bắt đầu cung cấp "GenAi WorkAgent", một trợ lý AI tập trung hóa các tài liệu, quy định và hướng dẫn nội bộ

Sự chuyển đổi sang AI: Yakiniku King giới thiệu hệ thống phản hồi tự động bằng AI.

Sự chuyển đổi sang AI: Yakiniku King giới thiệu hệ thống phản hồi tự động bằng AI.

0:00 11/2/26

Công ty AI Shift (quận Shibuya, Tokyo) thông báo rằng trợ lý ảo AI của họ, "AI Worker VoiceAgent," đã được đưa vào sử dụng tại chuỗi cửa hàng Yakiniku King của tập đoàn Monogatari

Minh họa quá tr�ình kiểm tra ngoại tuyến bằng AI của MiroCrie

Minh họa quá trình kiểm tra ngoại tuyến bằng AI của MiroCrie

0:00 11/2/26

Tại FOODEX JAPAN 2026, được tổ chức tại Tokyo Big Sight, Mirocle (Thành phố Nankoku, tỉnh Kochi) sẽ ra mắt phiên bản alpha của "Mirocle AI Offline Inspection"

Kế hoạch tối ưu hóa giới thiệu máy chủ Rosetta AI

Kế hoạch tối ưu hóa giới thiệu máy chủ Rosetta AI

0:00 11/2/26

Công ty Rosetta (Tokyo) vừa ra mắt gói dịch vụ cao cấp cho Metareal IF, một hệ thống trí tuệ nhân tạo (AI) dự đoán thời điểm tối ưu để cài đặt máy chủ cho doanh nghiệp.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
GenAi AI Agent hiện đã có sẵn.

GenAi AI Agent hiện đã có sẵn.

0:00 11/2/26

Công ty GenAi (Shibuya-ku, Tokyo) thông báo sẽ bắt đầu cung cấp "GenAi WorkAgent", một trợ lý AI tập trung hóa các tài liệu, quy định và hướng dẫn nội bộ

Sự chuyển đổi sang AI: Yakiniku King giới thiệu hệ thống phản hồi tự động bằng AI.

Sự chuyển đổi sang AI: Yakiniku King giới thiệu hệ thống phản hồi tự động bằng AI.

0:00 11/2/26

Công ty AI Shift (quận Shibuya, Tokyo) thông báo rằng trợ lý ảo AI của họ, "AI Worker VoiceAgent," đã được đưa vào sử dụng tại chuỗi cửa hàng Yakiniku King của tập đoàn Monogatari

Minh họa quá trình kiểm tra ngoại tuyến bằng AI của MiroCrie

Minh họa quá trình kiểm tra ngoại tuyến bằng AI của MiroCrie

0:00 11/2/26

Tại FOODEX JAPAN 2026, được tổ chức tại Tokyo Big Sight, Mirocle (Thành phố Nankoku, tỉnh Kochi) sẽ ra mắt phiên bản alpha của "Mirocle AI Offline Inspection"

Kế hoạch tối ưu hóa giới thiệu máy chủ Rosetta AI

Kế hoạch tối ưu hóa giới thiệu máy chủ Rosetta AI

0:00 11/2/26

Công ty Rosetta (Tokyo) vừa ra mắt gói dịch vụ cao cấp cho Metareal IF, một hệ thống trí tuệ nhân tạo (AI) dự đoán thời điểm tối ưu để cài đặt máy chủ cho doanh nghiệp.

bottom of page