Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
%20(1).webp)
Antropik “Studi tentang generalisasi model bahasa skala besar menggunakan fungsi pengaruh”
Generatived
16/8/23, 09.40
Anthropic baru-baru ini menerbitkan makalah inovatif berjudul "Mempelajari Generalisasi Model Bahasa Skala Besar Menggunakan Fungsi Pengaruh." Makalah ini membahas pendekatan top-down untuk memahami cara kerja model bahasa dan mengungkapkan bagaimana model ini menggeneralisasi data pelatihan. Ketika model bahasa menjadi lebih kuat dan risikonya menjadi lebih jelas, terdapat kebutuhan yang semakin besar untuk memahami apa yang menyebabkan model bahasa berperilaku. Penelitian sebelumnya oleh Anthropic menunjukkan bahwa model bahasa berskala besar menunjukkan perubahan kepribadian dan perilaku sebagai akibat dari penskalaan dan penyesuaian. Untuk benar-benar memahami perubahan ini, penting untuk melihat lebih dekat cara kerja model dan menentukan apakah keluarannya bergantung pada memori atau pemrosesan tingkat yang lebih tinggi. Dalam makalah terbarunya, Anthropic memperkenalkan fungsi pengaruh sebagai pendekatan pelengkap terhadap kemampuan interpretasi. Fungsi pengaruh adalah metode statistik yang menentukan kontribusi signifikan sampel pelatihan terhadap keluaran model. Dengan menganalisis dampak rangkaian pelatihan tertentu, peneliti dapat memperoleh wawasan tentang bagaimana model menggeneralisasi data pelatihan. Salah satu temuan utama dari penelitian ini adalah seiring bertambahnya ukuran model, pola generalisasi menjadi lebih abstrak. Misalnya, saat memeriksa respons model terhadap kueri tentang tidak dimatikan, urutan yang memengaruhi model yang lebih kecil tidak terkait secara semantik, namun berbagi token yang tumpang tindih. Sebaliknya, rangkaian yang memengaruhi model yang lebih besar secara konseptual terkait dan melibatkan tema-tema seperti naluri bertahan hidup dan emosi mirip manusia dalam AI. Studi ini juga menyelidiki efek lintas bahasa dan menunjukkan bahwa seiring bertambahnya ukuran model, efek kueri yang diterjemahkan menjadi lebih kuat secara signifikan. Temuan ini menyoroti pentingnya mempertimbangkan keragaman linguistik ketika menganalisis pola generalisasi dalam model bahasa. Lebih lanjut, penelitian ini menghilangkan anggapan bahwa keluaran model dihasilkan dari hafalan murni. Pengaruh tersebut biasanya mengikuti distribusi hukum kekuasaan, dengan sebagian kecil data pelatihan memiliki pengaruh paling besar, namun pengaruhnya masih tersebar. Model ini mengilustrasikan proses generalisasi yang lebih kompleks dan bernuansa daripada sekadar menghitung contoh pelatihan individual di tingkat token. Fungsi pengaruh tidak hanya memberikan skor pengaruh bernilai skalar untuk setiap rangkaian pelatihan, namun juga memberikan wawasan tentang bagaimana pengaruh didistribusikan dalam jaringan saraf. Rata-rata, pengaruhnya didistribusikan secara merata di antara berbagai lapisan jaringan. Namun, untuk kueri pengaruh tertentu, pengaruh cenderung dilokalisasi ke bagian jaringan tertentu, dengan lapisan bawah dan atas menangkap informasi tekstual terperinci, dan lapisan tengah menangkap tingkat tematik yang lebih abstrak. Meskipun penelitian ini berfokus pada model terlatih, Anthropic juga ingin memperluas penelitiannya hingga penyempurnaan. Penyempurnaan melibatkan model pelatihan berdasarkan berbagai tujuan pembelajaran penguatan yang diawasi, yang dapat memberikan hasil dan tantangan yang mengejutkan. Kemampuan untuk melokalisasi pengaruh pada lapisan atau token tertentu juga membuka kemungkinan menghubungkan fungsi pengaruh dengan interpretasi mekanistik, yang pada akhirnya menentukan neuron dan sirkuit yang terlibat dalam pola generalisasi tertentu. Dengan mengungkap mekanisme di balik keluaran model dan pola generalisasi, peneliti dapat memprediksi kemampuan AI dengan lebih akurat dan menyesuaikan sistem AI dengan preferensi manusia. Hasil penelitian ini memiliki implikasi luas bagi pengembangan dan penerapan model bahasa skala besar di masa depan.
Bagikan artikel ini:
Tin tức mới nhất
Ulasan Asisten AI baru Yoro-kun
6/3/26, 00.00
Review (Chuo-ku, Osaka) telah menambahkan asisten pencarian baru, "Yorozu AI Assistant (biasanya dikenal sebagai Yoro-kun)," ke platform datanya "YOROZU DATA."
Fitur ulasan AI LINE Yahoo! diperkenalkan
6/3/26, 00.00
LINE Yahoo! (Tokyo) telah memperkenalkan fitur tinjauan AI ke alat layanan mandiri "Quick Survey" untuk platform riset khusus ponsel pintar mereka, LINE Research.
Teknik Karir AI Komunikasi AP
6/3/26, 00.00
AP Communications (Chiyoda-ku, Tokyo) telah mengumumkan bahwa mereka akan melanjutkan program podcast
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Ulasan Asisten AI baru Yoro-kun
6/3/26, 00.00
Review (Chuo-ku, Osaka) telah menambahkan asisten pencarian baru, "Yorozu AI Assistant (biasanya dikenal sebagai Yoro-kun)," ke platform datanya "YOROZU DATA."
Fitur ulasan AI LINE Yahoo! diperkenalkan
6/3/26, 00.00
LINE Yahoo! (Tokyo) telah memperkenalkan fitur tinjauan AI ke alat layanan mandiri "Quick Survey" untuk platform riset khusus ponsel pintar mereka, LINE Research.
Teknik Karir AI Komunikasi AP
6/3/26, 00.00
AP Communications (Chiyoda-ku, Tokyo) telah mengumumkan bahwa mereka akan melanjutkan program podcast



%20(1).webp)


