top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

Pic2Word: Memetakan gambar ke kata-kata untuk meningkatkan pencarian gambar

Menurut Google, mahasiswa riset Kuniaki Saito dan Ilmuwan Riset Kihyuk Sohn dari tim AI Google Research telah mengembangkan sistem baru yang disebut Pic2Word yang dapat memetakan foto ke kata-kata untuk pencarian gambar komposit zero-shot.

Pengambilan gambar adalah fitur penting mesin pencari, dan pengguna biasanya menggunakan gambar atau teks sebagai kueri untuk menemukan gambar target yang diinginkan. Namun, sulit untuk mendeskripsikan gambar secara akurat menggunakan kata-kata. Hal ini menimbulkan masalah ketika pengguna mencari atribut tertentu pada gambar, seperti warna logo atau warna logo itu sendiri, yang mungkin berbeda dengan yang mereka temukan di website.


Untuk mengatasi masalah ini, artikel ini memperkenalkan Pengambilan Gambar Komposit (CIR), yang memungkinkan pengguna mengambil gambar berdasarkan kueri yang menggabungkan sampel gambar dan teks. Contoh teks menjelaskan cara memodifikasi gambar agar sama persis dengan target pencarian yang dituju. Pendekatan ini menggabungkan informasi gambar dan teks untuk mencari gambar dengan lebih akurat.

Namun, metode CIR yang ada memerlukan data berlabel dalam jumlah besar, mahal, dan memiliki kemampuan terbatas untuk menggeneralisasi kumpulan data yang berbeda. Untuk mengatasi tantangan ini, artikel ini mengusulkan tugas baru yang disebut pengambilan gambar sintetik zero-shot (ZS-CIR). Tujuan ZS-CIR adalah membangun model CIR tunggal yang dapat melakukan berbagai tugas CIR seperti mengonfigurasi objek, mengedit atribut, dan transformasi domain tanpa bergantung pada data triplet berlabel.

Metode yang diusulkan mengusulkan untuk menggunakan pasangan keterangan gambar berskala besar dan gambar tidak berlabel untuk melatih model pengambilan alih-alih data berlabel. Pendekatan ini sangat memudahkan pengumpulan data dan memungkinkan pelatihan model dalam skala besar.


Efektivitas model yang dilatih diverifikasi melalui berbagai eksperimen pada tugas CIR yang berbeda. Salah satu potensi arah penelitian di masa depan yang disebutkan dalam artikel ini adalah memperluas penggunaan data gambar dalam penelitian ini untuk memanfaatkan data keterangan untuk melatih jaringan pemetaan. Kemajuan ini menjanjikan peningkatan kemampuan pencarian gambar dan pengalaman pengguna di bidang pencarian gambar sintetis zero-shot.

Bagikan artikel ini:

Tin tức mới nhất
Authentic AI mengumumkan pengenalan model AI baru

Authentic AI mengumumkan pengenalan model AI baru

8/12/25, 00.00

Authentic AI (Minato-ku, Tokyo) mengumumkan telah memperkenalkan "Gemini 3 Pro" milik Google ke platform Generative AI "Maison AI."

Fungsi Baru Pelatihan Keterampilan Korporat SHIFT AI Ditambahkan

Fungsi Baru Pelatihan Keterampilan Korporat SHIFT AI Ditambahkan

8/12/25, 00.00

SHIFT AI (Shibuya-ku, Tokyo) mengumumkan telah menambahkan fitur "tes pemeriksaan pemahaman" baru ke 17 kursus di platform pembelajaran daring layanan pelatihan ulang keterampilan korporatnya

Pengumuman Layanan Baru Mainframe AI Kindrill

Pengumuman Layanan Baru Mainframe AI Kindrill

8/12/25, 00.00

Kindrill (New York) telah mengumumkan layanan baru yang menggabungkan keahliannya di bidang mainframe dengan teknologi AI.

Buku Putih Dukungan Implementasi AX AI Dirilis

Buku Putih Dukungan Implementasi AX AI Dirilis

8/12/25, 00.00

AX (Kota Fukuoka) telah merilis white paper untuk mendukung perusahaan dalam memperkenalkan AI

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Authentic AI mengumumkan pengenalan model AI baru

Authentic AI mengumumkan pengenalan model AI baru

8/12/25, 00.00

Authentic AI (Minato-ku, Tokyo) mengumumkan telah memperkenalkan "Gemini 3 Pro" milik Google ke platform Generative AI "Maison AI."

Fungsi Baru Pelatihan Keterampilan Korporat SHIFT AI Ditambahkan

Fungsi Baru Pelatihan Keterampilan Korporat SHIFT AI Ditambahkan

8/12/25, 00.00

SHIFT AI (Shibuya-ku, Tokyo) mengumumkan telah menambahkan fitur "tes pemeriksaan pemahaman" baru ke 17 kursus di platform pembelajaran daring layanan pelatihan ulang keterampilan korporatnya

Pengumuman Layanan Baru Mainframe AI Kindrill

Pengumuman Layanan Baru Mainframe AI Kindrill

8/12/25, 00.00

Kindrill (New York) telah mengumumkan layanan baru yang menggabungkan keahliannya di bidang mainframe dengan teknologi AI.

Buku Putih Dukungan Implementasi AX AI Dirilis

Buku Putih Dukungan Implementasi AX AI Dirilis

8/12/25, 00.00

AX (Kota Fukuoka) telah merilis white paper untuk mendukung perusahaan dalam memperkenalkan AI

bottom of page