top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

Pic2Word: Memetakan gambar ke kata-kata untuk meningkatkan pencarian gambar

Menurut Google, mahasiswa riset Kuniaki Saito dan Ilmuwan Riset Kihyuk Sohn dari tim AI Google Research telah mengembangkan sistem baru yang disebut Pic2Word yang dapat memetakan foto ke kata-kata untuk pencarian gambar komposit zero-shot.

Pengambilan gambar adalah fitur penting mesin pencari, dan pengguna biasanya menggunakan gambar atau teks sebagai kueri untuk menemukan gambar target yang diinginkan. Namun, sulit untuk mendeskripsikan gambar secara akurat menggunakan kata-kata. Hal ini menimbulkan masalah ketika pengguna mencari atribut tertentu pada gambar, seperti warna logo atau warna logo itu sendiri, yang mungkin berbeda dengan yang mereka temukan di website.


Untuk mengatasi masalah ini, artikel ini memperkenalkan Pengambilan Gambar Komposit (CIR), yang memungkinkan pengguna mengambil gambar berdasarkan kueri yang menggabungkan sampel gambar dan teks. Contoh teks menjelaskan cara memodifikasi gambar agar sama persis dengan target pencarian yang dituju. Pendekatan ini menggabungkan informasi gambar dan teks untuk mencari gambar dengan lebih akurat.

Namun, metode CIR yang ada memerlukan data berlabel dalam jumlah besar, mahal, dan memiliki kemampuan terbatas untuk menggeneralisasi kumpulan data yang berbeda. Untuk mengatasi tantangan ini, artikel ini mengusulkan tugas baru yang disebut pengambilan gambar sintetik zero-shot (ZS-CIR). Tujuan ZS-CIR adalah membangun model CIR tunggal yang dapat melakukan berbagai tugas CIR seperti mengonfigurasi objek, mengedit atribut, dan transformasi domain tanpa bergantung pada data triplet berlabel.

Metode yang diusulkan mengusulkan untuk menggunakan pasangan keterangan gambar berskala besar dan gambar tidak berlabel untuk melatih model pengambilan alih-alih data berlabel. Pendekatan ini sangat memudahkan pengumpulan data dan memungkinkan pelatihan model dalam skala besar.


Efektivitas model yang dilatih diverifikasi melalui berbagai eksperimen pada tugas CIR yang berbeda. Salah satu potensi arah penelitian di masa depan yang disebutkan dalam artikel ini adalah memperluas penggunaan data gambar dalam penelitian ini untuk memanfaatkan data keterangan untuk melatih jaringan pemetaan. Kemajuan ini menjanjikan peningkatan kemampuan pencarian gambar dan pengalaman pengguna di bidang pencarian gambar sintetis zero-shot.

Bagikan artikel ini:

Tin tức mới nhất
Mendukung Meiji dengan pelatihan AI And.dot

Mendukung Meiji dengan pelatihan AI And.dot

8/12/25, 00.00

And.dot (Shibuya-ku, Tokyo) menyediakan sesi pelatihan lokakarya tentang "Bisnis Baru x Memanfaatkan Generative AI" untuk Departemen Strategi Bisnis Inovasi Meiji (Chuo-ku, Tokyo).

Pengumuman Peningkatan Agen AI BLUEISH

Pengumuman Peningkatan Agen AI BLUEISH

8/12/25, 00.00

BLUEISH (Minato-ku, Tokyo) telah mengumumkan peningkatan pada platform agen AI perusahaannya, "BLUEISH Agents."

Polimill: Dukungan keputusan dengan partisipasi warga AI

Polimill: Dukungan keputusan dengan partisipasi warga AI

8/12/25, 00.00

Polimill (Minato-ku, Tokyo) bertujuan untuk mengembangkan "pengambilan keputusan publik itu sendiri" dengan memanfaatkan partisipasi warga dan Generative AI.

Dukungan rehabilitasi Rosetta AI akan dimulai

Dukungan rehabilitasi Rosetta AI akan dimulai

8/12/25, 00.00

Rosetta (Tokyo), anggota Metareal Group, telah mengembangkan agen AI untuk fasilitas rehabilitasi yang disebut Metareal Rehab Device (Metareal RD)

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Mendukung Meiji dengan pelatihan AI And.dot

Mendukung Meiji dengan pelatihan AI And.dot

8/12/25, 00.00

And.dot (Shibuya-ku, Tokyo) menyediakan sesi pelatihan lokakarya tentang "Bisnis Baru x Memanfaatkan Generative AI" untuk Departemen Strategi Bisnis Inovasi Meiji (Chuo-ku, Tokyo).

Pengumuman Peningkatan Agen AI BLUEISH

Pengumuman Peningkatan Agen AI BLUEISH

8/12/25, 00.00

BLUEISH (Minato-ku, Tokyo) telah mengumumkan peningkatan pada platform agen AI perusahaannya, "BLUEISH Agents."

Polimill: Dukungan keputusan dengan partisipasi warga AI

Polimill: Dukungan keputusan dengan partisipasi warga AI

8/12/25, 00.00

Polimill (Minato-ku, Tokyo) bertujuan untuk mengembangkan "pengambilan keputusan publik itu sendiri" dengan memanfaatkan partisipasi warga dan Generative AI.

Dukungan rehabilitasi Rosetta AI akan dimulai

Dukungan rehabilitasi Rosetta AI akan dimulai

8/12/25, 00.00

Rosetta (Tokyo), anggota Metareal Group, telah mengembangkan agen AI untuk fasilitas rehabilitasi yang disebut Metareal Rehab Device (Metareal RD)

bottom of page