top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

Pic2Word: Memetakan gambar ke kata-kata untuk meningkatkan pencarian gambar

Menurut Google, mahasiswa riset Kuniaki Saito dan Ilmuwan Riset Kihyuk Sohn dari tim AI Google Research telah mengembangkan sistem baru yang disebut Pic2Word yang dapat memetakan foto ke kata-kata untuk pencarian gambar komposit zero-shot.

Pengambilan gambar adalah fitur penting mesin pencari, dan pengguna biasanya menggunakan gambar atau teks sebagai kueri untuk menemukan gambar target yang diinginkan. Namun, sulit untuk mendeskripsikan gambar secara akurat menggunakan kata-kata. Hal ini menimbulkan masalah ketika pengguna mencari atribut tertentu pada gambar, seperti warna logo atau warna logo itu sendiri, yang mungkin berbeda dengan yang mereka temukan di website.


Untuk mengatasi masalah ini, Google memperkenalkan Pengambilan Gambar Komposit (CIR) dalam artikel ini, yang memungkinkan pengguna mengambil gambar berdasarkan kueri yang menggabungkan sampel gambar dan teks. Contoh teks menjelaskan cara memodifikasi gambar agar sama persis dengan target pencarian yang dituju. Pendekatan ini menggabungkan informasi gambar dan teks untuk mencari gambar dengan lebih akurat.

Namun, metode CIR yang ada memerlukan data berlabel dalam jumlah besar, mahal, dan memiliki kemampuan terbatas untuk menggeneralisasi kumpulan data yang berbeda. Untuk mengatasi tantangan ini, artikel ini mengusulkan tugas baru yang disebut pengambilan gambar sintetik zero-shot (ZS-CIR). Tujuan ZS-CIR adalah membangun model CIR tunggal yang dapat melakukan berbagai tugas CIR seperti mengonfigurasi objek, mengedit atribut, dan transformasi domain tanpa bergantung pada data triplet berlabel.

Metode yang diusulkan mengusulkan untuk menggunakan pasangan keterangan gambar berskala besar dan gambar tidak berlabel untuk melatih model pengambilan alih-alih data berlabel. Pendekatan ini sangat memudahkan pengumpulan data dan memungkinkan pelatihan model dalam skala besar.


Efektivitas model yang dilatih diverifikasi melalui berbagai eksperimen pada tugas CIR yang berbeda. Salah satu potensi arah penelitian di masa depan yang disebutkan dalam artikel ini adalah memperluas penggunaan data gambar dalam penelitian ini untuk memanfaatkan data keterangan untuk melatih jaringan pemetaan. Kemajuan ini menjanjikan peningkatan kemampuan pencarian gambar dan pengalaman pengguna di bidang pencarian gambar sintetis zero-shot.

Bagikan artikel ini:

Berita terkini
Layanan respons otomatis terkait AIBOT LINE diluncurkan

Layanan respons otomatis terkait AIBOT LINE diluncurkan

24/12/4 4:30

MOICA (lokasi kantor pusat tidak diketahui) sedang mengembangkan layanan SaaS yang disebut "MOICA AIBOT" yang menyediakan chatbot percakapan Generative AI .

PLAN-B com/PASS siaran terlewat tersedia

PLAN-B com/PASS siaran terlewat tersedia

24/12/4 4:30

PLAN-B (Shinagawa-ku, Tokyo) telah mengumumkan akan menayangkan semua sesi konferensi pemasaran "com/PASS" yang diadakan pada bulan November 2024 pada tanggal 10 dan 11 Desember.

First Accounting mengadakan seminar AI akuntansi

First Accounting mengadakan seminar AI akuntansi

24/12/4 4:30

First Accounting (Minato-ku, Tokyo) telah mengumumkan akan mengadakan Webinar Week selama empat hari mulai tanggal 16 Desember.

Fitur onboarding Findy AI ditambahkan

Fitur onboarding Findy AI ditambahkan

24/12/4 4:30

Findy (Shinagawa, Tokyo) telah mengumumkan bahwa mereka telah menambahkan "fungsi laporan orientasi β menggunakan Generative AI" ke SaaS "Findy Team+,"

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Ikuti kami

  • Facebook
  • X

Bahasa

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Layanan respons otomatis terkait AIBOT LINE diluncurkan

Layanan respons otomatis terkait AIBOT LINE diluncurkan

24/12/4 4:30

MOICA (lokasi kantor pusat tidak diketahui) sedang mengembangkan layanan SaaS yang disebut "MOICA AIBOT" yang menyediakan chatbot percakapan Generative AI .

PLAN-B com/PASS siaran terlewat tersedia

PLAN-B com/PASS siaran terlewat tersedia

24/12/4 4:30

PLAN-B (Shinagawa-ku, Tokyo) telah mengumumkan akan menayangkan semua sesi konferensi pemasaran "com/PASS" yang diadakan pada bulan November 2024 pada tanggal 10 dan 11 Desember.

First Accounting mengadakan seminar AI akuntansi

First Accounting mengadakan seminar AI akuntansi

24/12/4 4:30

First Accounting (Minato-ku, Tokyo) telah mengumumkan akan mengadakan Webinar Week selama empat hari mulai tanggal 16 Desember.

Fitur onboarding Findy AI ditambahkan

Fitur onboarding Findy AI ditambahkan

24/12/4 4:30

Findy (Shinagawa, Tokyo) telah mengumumkan bahwa mereka telah menambahkan "fungsi laporan orientasi β menggunakan Generative AI" ke SaaS "Findy Team+,"

bottom of page