Argos Meningkatkan Keandalan Agen AI Melalui Peningkatan 125/3897

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

Argos Meningkatkan Keandalan Agen AI Melalui Peningkatan

Generatived

22/1/26, 00.00

Meskipun sistem AI telah membuat kemajuan besar dalam pengenalan gambar, pembangkitan bahasa, dan eksekusi tugas, mereka sering membuat kesalahan yang tidak terduga, menimbulkan kekhawatiran tentang keamanan dan keandalan. Kesalahan ini dihasilkan dari agen AI yang belajar berdasarkan plausibilitas daripada akurasi, menghasilkan keluaran yang tampak benar berdasarkan informasi yang salah. Seiring AI semakin terintegrasi ke dalam aplikasi dunia nyata, memastikan keputusan AI didasarkan pada data lingkungan aktual menjadi sangat penting.

Argos, sebuah kerangka kerja baru, bertujuan untuk meningkatkan keandalan agen AI dengan berfokus pada pembelajaran penguatan (reinforcement learning), di mana model AI belajar melalui imbalan dan hukuman. Tidak seperti model tradisional yang hanya memberi imbalan pada tindakan yang benar, Argos juga mengevaluasi penalaran di balik tindakan tersebut. Dengan memanfaatkan model skala besar dan pemeriksaan berbasis aturan, Argos memastikan bahwa AI merujuk pada objek dan peristiwa dalam inputnya dan bahwa kesimpulannya konsisten dengan pengamatan.

Argos beroperasi sebagai lapisan validasi pada model multimodal, meneliti akurasi keluaran model, keberadaan objek dan peristiwa yang dirujuk, dan konsistensi kesimpulan dengan bukti visual. Argos menggunakan fungsi agregasi berpintu untuk menyeimbangkan pentingnya skor yang berbeda, dan hanya menekankan pemeriksaan inferensi ketika outputnya benar. Pendekatan ini mencegah umpan balik yang tidak dapat diandalkan memengaruhi pelatihan dan memberikan sinyal penghargaan yang stabil untuk pembelajaran penguatan.

Dampak Argos terlihat jelas dalam kemampuannya untuk melatih model yang mengungguli model dasar yang ada dalam tugas penalaran spasial dan mengurangi halusinasi. Argos juga memungkinkan model untuk berkinerja lebih baik dalam tugas-tugas dunia nyata dengan lebih sedikit sampel pelatihan, menyoroti pentingnya desain penghargaan dalam menciptakan agen AI yang efisien. Penelitian ini menunjukkan pergeseran menuju agen AI yang secara sistematis membangun inferensi berdasarkan input dunia nyata, dengan potensi aplikasi di berbagai domain dan meningkatkan keamanan serta keandalan sistem AI.

Sumber: Berita terbaru - Sumber, Microsoft

Bagikan artikel ini:

Tin tức mới nhất

Otomatisasi pengujian E2E menggunakan Sun Asterisk AI

1/1/26, 00.00

Sun Asterisk (Chiyoda-ku, Tokyo) telah mengumumkan peluncuran "AI-Ready* QA E2E," sebuah solusi otomatisasi pengujian end-to-end yang memanfaatkan sepenuhnya kecerdasan buatan (AI).

Baca lebih lanjut

zapath × Verbex Voice AI untuk dukungan klinik

1/1/26, 00.00

zapath (Shibuya-ku, Tokyo) telah mengumumkan kemitraan dengan Verbex (Shibuya-ku, Tokyo), sebuah perusahaan platform AI suara.

Baca lebih lanjut

Mempromosikan model operasional AI Ilgurum dan Atalla.

1/1/26, 00.00

Ilgurumu (Kita-ku, Osaka) mengumumkan bahwa Atalla (Shinjuku-ku) telah bergabung dengan "Program Mitra Manajer Kampanye AD EBiS."

Baca lebih lanjut

Emirates dan OpenAI mengumumkan kemitraan.

1/1/26, 00.00

Emirates (Dubai) telah mengumumkan kolaborasi strategis dengan OpenAI, pemimpin di bidang AI dari AS.

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Pembuat Seni/Ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI

AI berteknologi besar

OpenAI/ChatGPT

AI generasi inovatif

AI generasi berbasis teks

AI inovatif Jepang

Dasar-dasar AI generatif

Petunjuk dasar aplikasi AI

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Berita terkini

Otomatisasi pengujian E2E menggunakan Sun Asterisk AI

1/1/26, 00.00

Sun Asterisk (Chiyoda-ku, Tokyo) telah mengumumkan peluncuran "AI-Ready* QA E2E," sebuah solusi otomatisasi pengujian end-to-end yang memanfaatkan sepenuhnya kecerdasan buatan (AI).

Baca lebih lanjut

zapath × Verbex Voice AI untuk dukungan klinik

1/1/26, 00.00

zapath (Shibuya-ku, Tokyo) telah mengumumkan kemitraan dengan Verbex (Shibuya-ku, Tokyo), sebuah perusahaan platform AI suara.

Baca lebih lanjut

Mempromosikan model operasional AI Ilgurum dan Atalla.

1/1/26, 00.00

Ilgurumu (Kita-ku, Osaka) mengumumkan bahwa Atalla (Shinjuku-ku) telah bergabung dengan "Program Mitra Manajer Kampanye AD EBiS."

Baca lebih lanjut

Emirates dan OpenAI mengumumkan kemitraan.

1/1/26, 00.00

Emirates (Dubai) telah mengumumkan kolaborasi strategis dengan OpenAI, pemimpin di bidang AI dari AS.

Baca lebih lanjut