Gemini Meluncurkan AI untuk Tugas Pemahaman Gambar Tingkat Lanjut 37/3880

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

Gemini Meluncurkan AI untuk Tugas Pemahaman Gambar Tingkat Lanjut

Generatived

23/7/25, 00.00

Gemini menghadirkan dimensi baru pada pemahaman visual AI, memungkinkannya mengurai deskripsi dan hubungan kompleks dalam sebuah gambar. Kemajuan ini memungkinkan AI mengidentifikasi objek tidak hanya menggunakan label sederhana, tetapi juga frasa kompleks, seperti mengidentifikasi "mobil terjauh". Inovasi ini meningkatkan kemampuan AI untuk berinteraksi dengan data visual dengan cara yang lebih bernuansa dan mirip manusia.

Kemampuan AI mencakup pemahaman hubungan objek, logika kondisional, konsep abstrak, teks dalam gambar, dan label multibahasa. Misalnya, Gemini dapat mengidentifikasi "orang yang memegang payung" dan menyaring "makanan vegetarian", yang menunjukkan kemampuannya dalam menangani berbagai pertanyaan detail. Kemampuan ini khususnya berguna untuk tugas-tugas yang membutuhkan pemahaman visual tingkat lanjut, seperti mengidentifikasi "bunga yang paling layu dalam sebuah karangan bunga" dan mengenali teks dalam gambar.

Aplikasi praktis segmentasi gambar percakapan Gemini sangat luas, mulai dari penyederhanaan pengeditan media kreatif hingga peningkatan pemantauan compliance keselamatan. Desainer kini dapat berinteraksi dengan gambar menggunakan bahasa alami, dan manajer keselamatan dapat mengidentifikasi perilaku yang tidak patuh dengan instruksi seperti "menyoroti karyawan yang tidak mengenakan helm pengaman." Penilai asuransi juga dapat membuat penilaian kerusakan yang lebih akurat dengan meminta AI untuk "Segment rumah yang mengalami kerusakan akibat cuaca." Hal ini menunjukkan kemampuan Gemini untuk memahami konsep-konsep abstrak.

Bagi para pengembang, teknologi Gemini merupakan langkah maju yang signifikan. Teknologi ini menawarkan model bahasa yang fleksibel dan tidak bergantung pada kelas yang telah ditentukan sebelumnya, sehingga memungkinkan terciptanya solusi yang disesuaikan untuk berbagai industri. Selain itu, pengalaman pengembang yang disederhanakan dengan satu API untuk semua kebutuhan segmentasi mendemokratisasi akses ke aplikasi visi tingkat lanjut, sehingga para pengembang dapat dengan mudah mengintegrasikan kemampuan pemahaman visual tingkat lanjut ke dalam produk mereka.

Sumber: Blog Pengembang Google

Bagikan artikel ini:

Tin tức mới nhất

OpenAI: Pendekatan baru untuk pengembangan berbasis AI

10/2/26, 00.00

OpenAI (San Francisco) telah menerbitkan artikel baru tentang metode pengembangan menggunakan Codex, sebuah model AI untuk pengkodean.

Baca lebih lanjut

Fundamental Umumkan Pendanaan Sebesar $255 Juta, Memperluas Kemampuan AI

10/2/26, 00.00

Fundamental, sebuah perusahaan AI yang berspesialisasi dalam analitik prediktif, telah mengumpulkan pendanaan sebesar $255 juta.

Baca lebih lanjut

Google Tech meluncurkan analisis video AI untuk atlet.

10/2/26, 00.00

Google Cloud telah memperkenalkan platform analisis video berbasis AI yang bertujuan untuk meningkatkan performa atlet tim nasional AS dalam olahraga seperti seluncur salju dan ski gaya bebas.

Baca lebih lanjut

Painkiller RTX Meluncurkan Tekstur Game yang Ditingkatkan dengan AI

10/2/26, 00.00

Painkiller RTX menetapkan tolok ukur baru untuk peningkatan visual dalam game dengan memanfaatkan Generative AI untuk meningkatkan resolusi tekstur lama menjadi material PBR berkualitas tinggi.

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Pembuat Seni/Ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI

AI berteknologi besar

OpenAI/ChatGPT

AI generasi inovatif

AI generasi berbasis teks

AI inovatif Jepang

Dasar-dasar AI generatif

Petunjuk dasar aplikasi AI

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Berita terkini

OpenAI: Pendekatan baru untuk pengembangan berbasis AI

10/2/26, 00.00

OpenAI (San Francisco) telah menerbitkan artikel baru tentang metode pengembangan menggunakan Codex, sebuah model AI untuk pengkodean.

Baca lebih lanjut

Fundamental Umumkan Pendanaan Sebesar $255 Juta, Memperluas Kemampuan AI

10/2/26, 00.00

Fundamental, sebuah perusahaan AI yang berspesialisasi dalam analitik prediktif, telah mengumpulkan pendanaan sebesar $255 juta.

Baca lebih lanjut

Google Tech meluncurkan analisis video AI untuk atlet.

10/2/26, 00.00

Google Cloud telah memperkenalkan platform analisis video berbasis AI yang bertujuan untuk meningkatkan performa atlet tim nasional AS dalam olahraga seperti seluncur salju dan ski gaya bebas.

Baca lebih lanjut

Painkiller RTX Meluncurkan Tekstur Game yang Ditingkatkan dengan AI

10/2/26, 00.00

Painkiller RTX menetapkan tolok ukur baru untuk peningkatan visual dalam game dengan memanfaatkan Generative AI untuk meningkatkan resolusi tekstur lama menjadi material PBR berkualitas tinggi.

Baca lebih lanjut