Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

Gemini 3 Pro meningkatkan visi AI dan data spasial
Generatived
9/12/25, 00.00
Gemini 3 Pro merupakan terobosan dalam AI, yang meningkatkan kemampuannya untuk memahami dan memproses data visual dan spasial yang kompleks. Model ini mencapai tolok ukur baru dalam penglihatan, menunjukkan kinerja superior dalam tugas-tugas seperti pemahaman dokumen, spasial, layar, dan video. Lebih lanjut, dengan menggunakan pengenalan karakter optik (OCR) canggih dan teknik inferensi visual, model ini mampu menafsirkan dokumen dunia nyata secara akurat, yang seringkali berantakan dan tidak terstruktur.
Model ini unggul dalam pemahaman dokumen, mengubah tabel dan anotasi matematika yang sebelumnya ditulis tangan menjadi kode terstruktur seperti HTML dan LaTeX. Gemini 3 Pro juga menunjukkan kemampuan inferensi yang superior, mengungguli manusia dalam tolok ukur seperti uji inferensi CharXiv. Model ini dapat menganalisis berbagai laporan, seperti data pendapatan Biro Sensus AS, yang memberikan perbandingan detail dan analisis kausal.
Dalam hal pemahaman spasial, akurasi Gemini 3 Pro dalam mengidentifikasi dan mereferensikan objek dalam gambar sangat bermanfaat untuk aplikasi robotika dan augmented reality (AR). Model ini dapat menghasilkan rencana berbasis spasial untuk membantu tugas-tugas seperti memilah sampah di meja yang berantakan atau mengidentifikasi item tertentu dalam buku panduan pengguna. Kemampuan pemahaman layar model ini telah ditunjukkan dalam interaksi dengan antarmuka komputer, otomatisasi tugas, dan pengalaman pengguna yang lebih baik.
Kemampuan pemahaman video yang ditingkatkan juga memungkinkan Gemini 3 Pro untuk menganalisis rekaman video dengan frame rate tinggi dan menangkap detail yang rumit, sehingga penting untuk aplikasi seperti analisis olahraga. Mode "berpikir" model ini menelusuri narasi kompleks dalam video, melampaui pengenalan objek sederhana untuk memahami sebab dan akibat yang mendasarinya.
Gemini 3 Pro diharapkan memiliki dampak yang luas, dengan potensi aplikasi di bidang-bidang seperti pendidikan, pencitraan medis, hukum, dan keuangan. Kemampuan visual yang ditingkatkan dapat membantu memecahkan masalah inferensi multimoda dalam pendidikan dan meningkatkan akurasi analisis citra medis. Profesional keuangan dan hukum dapat memanfaatkan kemampuan inferensi dokumen model ini untuk menavigasi alur kerja yang kompleks. Pengembang dapat mengontrol pemrosesan gambar melalui parameter media_resolution, yang memungkinkan mereka menyeimbangkan fidelitas visual dengan kinerja dan biaya.
Bagikan artikel ini:
Tin tức mới nhất
Peluncuran layanan data AI baru Dukungan real estat
9/12/25, 00.00
AI Data (Minato-ku, Tokyo) telah mulai menawarkan layanan berbasis AI baru yang disebut "AI PropertyPro di IDX" untuk penilai real estat, perusahaan manajemen aset, dan lainnya.
Yamariki Edge memperkenalkan alat video AI SORA2
9/12/25, 00.00
Yamariki Edge (Tokyo) telah sepenuhnya mengganti mesin pembuat video "Inst", alat posting video otomatis bertenaga AI yang mendukung pemasaran media sosial, ke AI generasi berikutnya "SORA2".
Fungsi diagnostik AIO gambar Amazon Picaro.ai diluncurkan
9/12/25, 00.00
Picaro.ai (Minato-ku, Tokyo) telah meluncurkan fungsi diagnostik AIO gambar yang kompatibel dengan Rufus untuk penjual Amazon .
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Peluncuran layanan data AI baru Dukungan real estat
9/12/25, 00.00
AI Data (Minato-ku, Tokyo) telah mulai menawarkan layanan berbasis AI baru yang disebut "AI PropertyPro di IDX" untuk penilai real estat, perusahaan manajemen aset, dan lainnya.
Yamariki Edge memperkenalkan alat video AI SORA2
9/12/25, 00.00
Yamariki Edge (Tokyo) telah sepenuhnya mengganti mesin pembuat video "Inst", alat posting video otomatis bertenaga AI yang mendukung pemasaran media sosial, ke AI generasi berikutnya "SORA2".
Fungsi diagnostik AIO gambar Amazon Picaro.ai diluncurkan
9/12/25, 00.00
Picaro.ai (Minato-ku, Tokyo) telah meluncurkan fungsi diagnostik AIO gambar yang kompatibel dengan Rufus untuk penjual Amazon .



%20(1).webp)


