Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Gemini ra mắt AI cho các nhiệm vụ hiểu hình ảnh nâng cao
Generatived
0:00 23/7/25
Gemini mang đến một chiều hướng mới cho khả năng hiểu hình ảnh của AI, cho phép nó phân tích các mô tả và mối quan hệ phức tạp trong một hình ảnh. Sự tiến bộ này cho phép AI nhận dạng các đối tượng không chỉ bằng các nhãn đơn giản mà còn bằng các cụm từ phức tạp, chẳng hạn như xác định ""chiếc xe xa nhất"". Sự đổi mới này cải thiện khả năng tương tác của AI với dữ liệu hình ảnh theo cách tinh tế hơn, giống con người hơn.
Khả năng của AI bao gồm hiểu các mối quan hệ đối tượng, logic điều kiện, khái niệm trừu tượng, văn bản trong hình ảnh và nhãn đa ngôn ngữ. Ví dụ, Gemini có thể nhận dạng ""người cầm ô"" và lọc ra ""đồ ăn chay"", thể hiện khả năng xử lý nhiều truy vấn chi tiết. Khả năng này đặc biệt hữu ích cho các tác vụ đòi hỏi khả năng hiểu biết thị giác nâng cao, chẳng hạn như nhận dạng ""bông hoa héo nhất trong bó hoa"" và nhận dạng văn bản trong hình ảnh.
Ứng dụng thực tế của phân đoạn hình ảnh đàm thoại của Gemini rất đa dạng, từ việc tinh giản biên tập nội dung sáng tạo đến tăng cường giám sát compliance an toàn. Các nhà thiết kế giờ đây có thể tương tác với hình ảnh bằng ngôn ngữ tự nhiên, và các nhà quản lý an toàn có thể xác định hành vi không tuân thủ bằng các hướng dẫn như ""làm nổi bật nhân viên không đội mũ bảo hiểm"". Các giám định viên bảo hiểm có thể đánh giá thiệt hại chính xác hơn bằng cách yêu cầu AI ""Segment nhà bị hư hại do thời tiết"". Điều này chứng minh khả năng hiểu các khái niệm trừu tượng của Gemini.
Đối với các nhà phát triển, công nghệ của Gemini là một bước tiến vượt bậc. Nó cung cấp các mô hình ngôn ngữ linh hoạt, không phụ thuộc vào các lớp được xác định trước, cho phép tạo ra các giải pháp tùy chỉnh cho nhiều ngành công nghiệp khác nhau. Ngoài ra, trải nghiệm dành cho nhà phát triển được đơn giản hóa với một API duy nhất cho tất cả các nhu cầu phân khúc, giúp dân chủ hóa quyền truy cập vào các ứng dụng thị giác tiên tiến, cho phép các nhà phát triển dễ dàng tích hợp các khả năng hiểu thị giác tiên tiến vào sản phẩm của họ.
Chia sẻ bài viết này:
Tin tức mới nhất
Triển khai đồng hành AI của Dassault Systèmes
0:00 19/2/26
Dassault Systèmes (Euronext Paris) đã công bố triển khai các "trợ lý ảo" chuyên gia được hỗ trợ bởi trí tuệ nhân tạo trên nền tảng 3DEXPERIENCE
Dự án thử nghiệm xác minh thông số kỹ thuật AI của Valtes và Persol
0:00 19/2/26
Valtes (quận Nishi, Osaka; quận Chiyoda, Tokyo) đã triển khai dự án thử nghiệm (PoC) sử dụng công cụ kiểm tra đặc tả kỹ thuật bằng trí tuệ nhân tạo "QuintSpect"
Chức năng mới của AI trường Mingaku đã được thêm vào.
0:00 19/2/26
Công ty Mingaku (Quận Chuo, Tokyo) đã bổ sung tính năng mới "Nhật ký Phát triển" vào nền tảng giáo dục "School AI" của mình.
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
Triển khai đồng hành AI của Dassault Systèmes
0:00 19/2/26
Dassault Systèmes (Euronext Paris) đã công bố triển khai các "trợ lý ảo" chuyên gia được hỗ trợ bởi trí tuệ nhân tạo trên nền tảng 3DEXPERIENCE
Dự án thử nghiệm xác minh thông số kỹ thuật AI của Valtes và Persol
0:00 19/2/26
Valtes (quận Nishi, Osaka; quận Chiyoda, Tokyo) đã triển khai dự án thử nghiệm (PoC) sử dụng công cụ kiểm tra đặc tả kỹ thuật bằng trí tuệ nhân tạo "QuintSpect"
Chức năng mới của AI trường Mingaku đã được thêm vào.
0:00 19/2/26
Công ty Mingaku (Quận Chuo, Tokyo) đã bổ sung tính năng mới "Nhật ký Phát triển" vào nền tảng giáo dục "School AI" của mình.

%20(1).webp)



