top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

Argos Meningkatkan Keandalan Agen AI Melalui Peningkatan

Generatived

22/1/26, 00.00

Meskipun sistem AI telah membuat kemajuan besar dalam pengenalan gambar, pembangkitan bahasa, dan eksekusi tugas, mereka sering membuat kesalahan yang tidak terduga, menimbulkan kekhawatiran tentang keamanan dan keandalan. Kesalahan ini dihasilkan dari agen AI yang belajar berdasarkan plausibilitas daripada akurasi, menghasilkan keluaran yang tampak benar berdasarkan informasi yang salah. Seiring AI semakin terintegrasi ke dalam aplikasi dunia nyata, memastikan keputusan AI didasarkan pada data lingkungan aktual menjadi sangat penting.

Argos, sebuah kerangka kerja baru, bertujuan untuk meningkatkan keandalan agen AI dengan berfokus pada pembelajaran penguatan (reinforcement learning), di mana model AI belajar melalui imbalan dan hukuman. Tidak seperti model tradisional yang hanya memberi imbalan pada tindakan yang benar, Argos juga mengevaluasi penalaran di balik tindakan tersebut. Dengan memanfaatkan model skala besar dan pemeriksaan berbasis aturan, Argos memastikan bahwa AI merujuk pada objek dan peristiwa dalam inputnya dan bahwa kesimpulannya konsisten dengan pengamatan.

Argos beroperasi sebagai lapisan validasi pada model multimodal, meneliti akurasi keluaran model, keberadaan objek dan peristiwa yang dirujuk, dan konsistensi kesimpulan dengan bukti visual. Argos menggunakan fungsi agregasi berpintu untuk menyeimbangkan pentingnya skor yang berbeda, dan hanya menekankan pemeriksaan inferensi ketika outputnya benar. Pendekatan ini mencegah umpan balik yang tidak dapat diandalkan memengaruhi pelatihan dan memberikan sinyal penghargaan yang stabil untuk pembelajaran penguatan.

Dampak Argos terlihat jelas dalam kemampuannya untuk melatih model yang mengungguli model dasar yang ada dalam tugas penalaran spasial dan mengurangi halusinasi. Argos juga memungkinkan model untuk berkinerja lebih baik dalam tugas-tugas dunia nyata dengan lebih sedikit sampel pelatihan, menyoroti pentingnya desain penghargaan dalam menciptakan agen AI yang efisien. Penelitian ini menunjukkan pergeseran menuju agen AI yang secara sistematis membangun inferensi berdasarkan input dunia nyata, dengan potensi aplikasi di berbagai domain dan meningkatkan keamanan serta keandalan sistem AI.

Bagikan artikel ini:

Tin tức mới nhất
Otomatisasi pengujian E2E menggunakan Sun Asterisk AI

Otomatisasi pengujian E2E menggunakan Sun Asterisk AI

1/1/26, 00.00

Sun Asterisk (Chiyoda-ku, Tokyo) telah mengumumkan peluncuran "AI-Ready* QA E2E," sebuah solusi otomatisasi pengujian end-to-end yang memanfaatkan sepenuhnya kecerdasan buatan (AI).

zapath × Verbex Voice AI untuk dukungan klinik

zapath × Verbex Voice AI untuk dukungan klinik

1/1/26, 00.00

zapath (Shibuya-ku, Tokyo) telah mengumumkan kemitraan dengan Verbex (Shibuya-ku, Tokyo), sebuah perusahaan platform AI suara.

Mempromosikan model operasional AI Ilgurum dan Atalla.

Mempromosikan model operasional AI Ilgurum dan Atalla.

1/1/26, 00.00

Ilgurumu (Kita-ku, Osaka) mengumumkan bahwa Atalla (Shinjuku-ku) telah bergabung dengan "Program Mitra Manajer Kampanye AD EBiS."

Emirates dan OpenAI mengumumkan kemitraan.

Emirates dan OpenAI mengumumkan kemitraan.

1/1/26, 00.00

Emirates (Dubai) telah mengumumkan kolaborasi strategis dengan OpenAI, pemimpin di bidang AI dari AS.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Otomatisasi pengujian E2E menggunakan Sun Asterisk AI

Otomatisasi pengujian E2E menggunakan Sun Asterisk AI

1/1/26, 00.00

Sun Asterisk (Chiyoda-ku, Tokyo) telah mengumumkan peluncuran "AI-Ready* QA E2E," sebuah solusi otomatisasi pengujian end-to-end yang memanfaatkan sepenuhnya kecerdasan buatan (AI).

zapath × Verbex Voice AI untuk dukungan klinik

zapath × Verbex Voice AI untuk dukungan klinik

1/1/26, 00.00

zapath (Shibuya-ku, Tokyo) telah mengumumkan kemitraan dengan Verbex (Shibuya-ku, Tokyo), sebuah perusahaan platform AI suara.

Mempromosikan model operasional AI Ilgurum dan Atalla.

Mempromosikan model operasional AI Ilgurum dan Atalla.

1/1/26, 00.00

Ilgurumu (Kita-ku, Osaka) mengumumkan bahwa Atalla (Shinjuku-ku) telah bergabung dengan "Program Mitra Manajer Kampanye AD EBiS."

Emirates dan OpenAI mengumumkan kemitraan.

Emirates dan OpenAI mengumumkan kemitraan.

1/1/26, 00.00

Emirates (Dubai) telah mengumumkan kolaborasi strategis dengan OpenAI, pemimpin di bidang AI dari AS.

bottom of page