Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

Argos Meningkatkan Keandalan Agen AI Melalui Peningkatan
Generatived
22/1/26, 00.00
Meskipun sistem AI telah membuat kemajuan besar dalam pengenalan gambar, pembangkitan bahasa, dan eksekusi tugas, mereka sering membuat kesalahan yang tidak terduga, menimbulkan kekhawatiran tentang keamanan dan keandalan. Kesalahan ini dihasilkan dari agen AI yang belajar berdasarkan plausibilitas daripada akurasi, menghasilkan keluaran yang tampak benar berdasarkan informasi yang salah. Seiring AI semakin terintegrasi ke dalam aplikasi dunia nyata, memastikan keputusan AI didasarkan pada data lingkungan aktual menjadi sangat penting.
Argos, sebuah kerangka kerja baru, bertujuan untuk meningkatkan keandalan agen AI dengan berfokus pada pembelajaran penguatan (reinforcement learning), di mana model AI belajar melalui imbalan dan hukuman. Tidak seperti model tradisional yang hanya memberi imbalan pada tindakan yang benar, Argos juga mengevaluasi penalaran di balik tindakan tersebut. Dengan memanfaatkan model skala besar dan pemeriksaan berbasis aturan, Argos memastikan bahwa AI merujuk pada objek dan peristiwa dalam inputnya dan bahwa kesimpulannya konsisten dengan pengamatan.
Argos beroperasi sebagai lapisan validasi pada model multimodal, meneliti akurasi keluaran model, keberadaan objek dan peristiwa yang dirujuk, dan konsistensi kesimpulan dengan bukti visual. Argos menggunakan fungsi agregasi berpintu untuk menyeimbangkan pentingnya skor yang berbeda, dan hanya menekankan pemeriksaan inferensi ketika outputnya benar. Pendekatan ini mencegah umpan balik yang tidak dapat diandalkan memengaruhi pelatihan dan memberikan sinyal penghargaan yang stabil untuk pembelajaran penguatan.
Dampak Argos terlihat jelas dalam kemampuannya untuk melatih model yang mengungguli model dasar yang ada dalam tugas penalaran spasial dan mengurangi halusinasi. Argos juga memungkinkan model untuk berkinerja lebih baik dalam tugas-tugas dunia nyata dengan lebih sedikit sampel pelatihan, menyoroti pentingnya desain penghargaan dalam menciptakan agen AI yang efisien. Penelitian ini menunjukkan pergeseran menuju agen AI yang secara sistematis membangun inferensi berdasarkan input dunia nyata, dengan potensi aplikasi di berbagai domain dan meningkatkan keamanan serta keandalan sistem AI.
Bagikan artikel ini:
Tin tức mới nhất
Pameran bersama Systena di Automotive 2026
21/1/26, 00.00
Systena (Minato-ku, Tokyo) akan berpartisipasi dalam Pameran Dunia Otomotif ke-18, yang akan diadakan di Tokyo Big Sight selama tiga hari mulai tanggal 21 hingga 23 Januari 2026.
Alat otomatisasi bisnis AI dasar diluncurkan.
21/1/26, 00.00
Basic (Chiyoda-ku, Tokyo) telah mulai menawarkan "workrun," sebuah layanan yang menggunakan AI untuk secara otomatis menjalankan proses bisnis antar alat.
Pengembangan AI untuk inspeksi menara Waymark infrastruktur.
21/1/26, 00.00
Japan Infrastructure Waymark (Minato-ku, Tokyo) telah mengembangkan AI pendukung inspeksi menara berdasarkan rekam jejaknya dalam inspeksi drone terhadap lebih dari 500 menara
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Pameran bersama Systena di Automotive 2026
21/1/26, 00.00
Systena (Minato-ku, Tokyo) akan berpartisipasi dalam Pameran Dunia Otomotif ke-18, yang akan diadakan di Tokyo Big Sight selama tiga hari mulai tanggal 21 hingga 23 Januari 2026.
Alat otomatisasi bisnis AI dasar diluncurkan.
21/1/26, 00.00
Basic (Chiyoda-ku, Tokyo) telah mulai menawarkan "workrun," sebuah layanan yang menggunakan AI untuk secara otomatis menjalankan proses bisnis antar alat.
Pengembangan AI untuk inspeksi menara Waymark infrastruktur.
21/1/26, 00.00
Japan Infrastructure Waymark (Minato-ku, Tokyo) telah mengembangkan AI pendukung inspeksi menara berdasarkan rekam jejaknya dalam inspeksi drone terhadap lebih dari 500 menara

%20(1).webp)



