top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

Argos Meningkatkan Keandalan Agen AI Melalui Peningkatan

Generatived

22/1/26, 00.00

Meskipun sistem AI telah membuat kemajuan besar dalam pengenalan gambar, pembangkitan bahasa, dan eksekusi tugas, mereka sering membuat kesalahan yang tidak terduga, menimbulkan kekhawatiran tentang keamanan dan keandalan. Kesalahan ini dihasilkan dari agen AI yang belajar berdasarkan plausibilitas daripada akurasi, menghasilkan keluaran yang tampak benar berdasarkan informasi yang salah. Seiring AI semakin terintegrasi ke dalam aplikasi dunia nyata, memastikan keputusan AI didasarkan pada data lingkungan aktual menjadi sangat penting.

Argos, sebuah kerangka kerja baru, bertujuan untuk meningkatkan keandalan agen AI dengan berfokus pada pembelajaran penguatan (reinforcement learning), di mana model AI belajar melalui imbalan dan hukuman. Tidak seperti model tradisional yang hanya memberi imbalan pada tindakan yang benar, Argos juga mengevaluasi penalaran di balik tindakan tersebut. Dengan memanfaatkan model skala besar dan pemeriksaan berbasis aturan, Argos memastikan bahwa AI merujuk pada objek dan peristiwa dalam inputnya dan bahwa kesimpulannya konsisten dengan pengamatan.

Argos beroperasi sebagai lapisan validasi pada model multimodal, meneliti akurasi keluaran model, keberadaan objek dan peristiwa yang dirujuk, dan konsistensi kesimpulan dengan bukti visual. Argos menggunakan fungsi agregasi berpintu untuk menyeimbangkan pentingnya skor yang berbeda, dan hanya menekankan pemeriksaan inferensi ketika outputnya benar. Pendekatan ini mencegah umpan balik yang tidak dapat diandalkan memengaruhi pelatihan dan memberikan sinyal penghargaan yang stabil untuk pembelajaran penguatan.

Dampak Argos terlihat jelas dalam kemampuannya untuk melatih model yang mengungguli model dasar yang ada dalam tugas penalaran spasial dan mengurangi halusinasi. Argos juga memungkinkan model untuk berkinerja lebih baik dalam tugas-tugas dunia nyata dengan lebih sedikit sampel pelatihan, menyoroti pentingnya desain penghargaan dalam menciptakan agen AI yang efisien. Penelitian ini menunjukkan pergeseran menuju agen AI yang secara sistematis membangun inferensi berdasarkan input dunia nyata, dengan potensi aplikasi di berbagai domain dan meningkatkan keamanan serta keandalan sistem AI.

Bagikan artikel ini:

Tin tức mới nhất
Pemantauan AI VideoTouch diluncurkan

Pemantauan AI VideoTouch diluncurkan

8/1/26, 00.00

VideoTouch (Shibuya-ku, Tokyo) akan meluncurkan layanan baru bernama "AI Monitoring" pada tanggal 7 Januari 2026, yang secara otomatis menganalisis dan mengevaluasi respons operator.

Dukungan komersialisasi pengkodean AI UNSON

Dukungan komersialisasi pengkodean AI UNSON

8/1/26, 00.00

UNSON (Chiyoda-ku, Tokyo) mengumumkan bahwa mereka akan mulai menawarkan "Paket Dukungan Komersialisasi Vibe Coding" mulai Januari 2026, yang akan membantu memigrasikan aplikasi prototipe

GMO Tenbin AI meluncurkan layanan Generative AI gambar baru.

GMO Tenbin AI meluncurkan layanan Generative AI gambar baru.

8/1/26, 00.00

GMO Tenbin AI (Shibuya-ku, Tokyo) mengumumkan bahwa mereka akan mulai menawarkan layanan Generative AI gambar baru, "Tenbin AI byGMO" dan "Tenbin AI Biz byGMO," mulai 26 Desember 2025.

Agen AI Rosetta Dental diluncurkan.

Agen AI Rosetta Dental diluncurkan.

8/1/26, 00.00

Rosetta (Tokyo) telah mulai menawarkan paket premium untuk agen AI-nya bagi klinik gigi, "Metareal DE."

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Pemantauan AI VideoTouch diluncurkan

Pemantauan AI VideoTouch diluncurkan

8/1/26, 00.00

VideoTouch (Shibuya-ku, Tokyo) akan meluncurkan layanan baru bernama "AI Monitoring" pada tanggal 7 Januari 2026, yang secara otomatis menganalisis dan mengevaluasi respons operator.

Dukungan komersialisasi pengkodean AI UNSON

Dukungan komersialisasi pengkodean AI UNSON

8/1/26, 00.00

UNSON (Chiyoda-ku, Tokyo) mengumumkan bahwa mereka akan mulai menawarkan "Paket Dukungan Komersialisasi Vibe Coding" mulai Januari 2026, yang akan membantu memigrasikan aplikasi prototipe

GMO Tenbin AI meluncurkan layanan Generative AI gambar baru.

GMO Tenbin AI meluncurkan layanan Generative AI gambar baru.

8/1/26, 00.00

GMO Tenbin AI (Shibuya-ku, Tokyo) mengumumkan bahwa mereka akan mulai menawarkan layanan Generative AI gambar baru, "Tenbin AI byGMO" dan "Tenbin AI Biz byGMO," mulai 26 Desember 2025.

Agen AI Rosetta Dental diluncurkan.

Agen AI Rosetta Dental diluncurkan.

8/1/26, 00.00

Rosetta (Tokyo) telah mulai menawarkan paket premium untuk agen AI-nya bagi klinik gigi, "Metareal DE."

bottom of page