top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

Gemini Meluncurkan AI untuk Tugas Pemahaman Gambar Tingkat Lanjut

Generatived

23/7/25, 00.00

Gemini menghadirkan dimensi baru pada pemahaman visual AI, memungkinkannya mengurai deskripsi dan hubungan kompleks dalam sebuah gambar. Kemajuan ini memungkinkan AI mengidentifikasi objek tidak hanya menggunakan label sederhana, tetapi juga frasa kompleks, seperti mengidentifikasi "mobil terjauh". Inovasi ini meningkatkan kemampuan AI untuk berinteraksi dengan data visual dengan cara yang lebih bernuansa dan mirip manusia.

Kemampuan AI mencakup pemahaman hubungan objek, logika kondisional, konsep abstrak, teks dalam gambar, dan label multibahasa. Misalnya, Gemini dapat mengidentifikasi "orang yang memegang payung" dan menyaring "makanan vegetarian", yang menunjukkan kemampuannya dalam menangani berbagai pertanyaan detail. Kemampuan ini khususnya berguna untuk tugas-tugas yang membutuhkan pemahaman visual tingkat lanjut, seperti mengidentifikasi "bunga yang paling layu dalam sebuah karangan bunga" dan mengenali teks dalam gambar.

Aplikasi praktis segmentasi gambar percakapan Gemini sangat luas, mulai dari penyederhanaan pengeditan media kreatif hingga peningkatan pemantauan compliance keselamatan. Desainer kini dapat berinteraksi dengan gambar menggunakan bahasa alami, dan manajer keselamatan dapat mengidentifikasi perilaku yang tidak patuh dengan instruksi seperti "menyoroti karyawan yang tidak mengenakan helm pengaman." Penilai asuransi juga dapat membuat penilaian kerusakan yang lebih akurat dengan meminta AI untuk "Segment rumah yang mengalami kerusakan akibat cuaca." Hal ini menunjukkan kemampuan Gemini untuk memahami konsep-konsep abstrak.

Bagi para pengembang, teknologi Gemini merupakan langkah maju yang signifikan. Teknologi ini menawarkan model bahasa yang fleksibel dan tidak bergantung pada kelas yang telah ditentukan sebelumnya, sehingga memungkinkan terciptanya solusi yang disesuaikan untuk berbagai industri. Selain itu, pengalaman pengembang yang disederhanakan dengan satu API untuk semua kebutuhan segmentasi mendemokratisasi akses ke aplikasi visi tingkat lanjut, sehingga para pengembang dapat dengan mudah mengintegrasikan kemampuan pemahaman visual tingkat lanjut ke dalam produk mereka.

Bagikan artikel ini:

Tin tức mới nhất
Pengembangan video Alps First AI Yamanashi Gorilla

Pengembangan video Alps First AI Yamanashi Gorilla

18/2/26, 00.00

Alps (Showa-cho, Nakakoma-gun, Prefektur Yamanashi) berkolaborasi dengan First AI (Kota Osaka, Prefektur Osaka) untuk mengembangkan konten video

Memperkenalkan SSO ke Asisten AI Lightblue

Memperkenalkan SSO ke Asisten AI Lightblue

18/2/26, 00.00

Lightblue (Chiyoda-ku, Tokyo) telah memperkenalkan fitur single sign-on untuk asisten AI-nya, "Lightblue," menggunakan "HENNGE One" dari HENNGE (Shibuya-ku, Tokyo).

LANY menyelenggarakan seminar tentang strategi hubungan masyarakat di era AI.

LANY menyelenggarakan seminar tentang strategi hubungan masyarakat di era AI.

17/2/26, 00.00

LANY (Distrik Shibuya, Tokyo) akan berbicara di seminar berjudul "PR yang akan dipilih oleh AI dan bertahan di tengah perubahan media" pada tanggal 20 Februari 2026.

Seminar Stockmark EV: Fokus pada Semikonduktor Generasi Berikutnya

Seminar Stockmark EV: Fokus pada Semikonduktor Generasi Berikutnya

17/2/26, 00.00

Stockmark (Minato-ku, Tokyo) akan menyelenggarakan seminar daring pada tanggal 19 Februari dengan judul "Teknologi Elektronik Daya Terdepan Mempercepat Evolusi Kendaraan Listrik

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Pengembangan video Alps First AI Yamanashi Gorilla

Pengembangan video Alps First AI Yamanashi Gorilla

18/2/26, 00.00

Alps (Showa-cho, Nakakoma-gun, Prefektur Yamanashi) berkolaborasi dengan First AI (Kota Osaka, Prefektur Osaka) untuk mengembangkan konten video

Memperkenalkan SSO ke Asisten AI Lightblue

Memperkenalkan SSO ke Asisten AI Lightblue

18/2/26, 00.00

Lightblue (Chiyoda-ku, Tokyo) telah memperkenalkan fitur single sign-on untuk asisten AI-nya, "Lightblue," menggunakan "HENNGE One" dari HENNGE (Shibuya-ku, Tokyo).

LANY menyelenggarakan seminar tentang strategi hubungan masyarakat di era AI.

LANY menyelenggarakan seminar tentang strategi hubungan masyarakat di era AI.

17/2/26, 00.00

LANY (Distrik Shibuya, Tokyo) akan berbicara di seminar berjudul "PR yang akan dipilih oleh AI dan bertahan di tengah perubahan media" pada tanggal 20 Februari 2026.

Seminar Stockmark EV: Fokus pada Semikonduktor Generasi Berikutnya

Seminar Stockmark EV: Fokus pada Semikonduktor Generasi Berikutnya

17/2/26, 00.00

Stockmark (Minato-ku, Tokyo) akan menyelenggarakan seminar daring pada tanggal 19 Februari dengan judul "Teknologi Elektronik Daya Terdepan Mempercepat Evolusi Kendaraan Listrik

bottom of page