Antropik “Studi tentang generalisasi model bahasa skala besar menggunakan fungsi pengaruh”

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

Antropik “Studi tentang generalisasi model bahasa skala besar menggunakan fungsi pengaruh”

Generatived

16/8/23, 09.40

Anthropic baru-baru ini menerbitkan makalah inovatif berjudul "Mempelajari Generalisasi Model Bahasa Skala Besar Menggunakan Fungsi Pengaruh." Makalah ini membahas pendekatan top-down untuk memahami cara kerja model bahasa dan mengungkapkan bagaimana model ini menggeneralisasi data pelatihan. Ketika model bahasa menjadi lebih kuat dan risikonya menjadi lebih jelas, terdapat kebutuhan yang semakin besar untuk memahami apa yang menyebabkan model bahasa berperilaku. Penelitian sebelumnya oleh Anthropic menunjukkan bahwa model bahasa berskala besar menunjukkan perubahan kepribadian dan perilaku sebagai akibat dari penskalaan dan penyesuaian. Untuk benar-benar memahami perubahan ini, penting untuk melihat lebih dekat cara kerja model dan menentukan apakah keluarannya bergantung pada memori atau pemrosesan tingkat yang lebih tinggi. Dalam makalah terbarunya, Anthropic memperkenalkan fungsi pengaruh sebagai pendekatan pelengkap terhadap kemampuan interpretasi. Fungsi pengaruh adalah metode statistik yang menentukan kontribusi signifikan sampel pelatihan terhadap keluaran model. Dengan menganalisis dampak rangkaian pelatihan tertentu, peneliti dapat memperoleh wawasan tentang bagaimana model menggeneralisasi data pelatihan. Salah satu temuan utama dari penelitian ini adalah seiring bertambahnya ukuran model, pola generalisasi menjadi lebih abstrak. Misalnya, saat memeriksa respons model terhadap kueri tentang tidak dimatikan, urutan yang memengaruhi model yang lebih kecil tidak terkait secara semantik, namun berbagi token yang tumpang tindih. Sebaliknya, rangkaian yang memengaruhi model yang lebih besar secara konseptual terkait dan melibatkan tema-tema seperti naluri bertahan hidup dan emosi mirip manusia dalam AI. Studi ini juga menyelidiki efek lintas bahasa dan menunjukkan bahwa seiring bertambahnya ukuran model, efek kueri yang diterjemahkan menjadi lebih kuat secara signifikan. Temuan ini menyoroti pentingnya mempertimbangkan keragaman linguistik ketika menganalisis pola generalisasi dalam model bahasa. Lebih lanjut, penelitian ini menghilangkan anggapan bahwa keluaran model dihasilkan dari hafalan murni. Pengaruh tersebut biasanya mengikuti distribusi hukum kekuasaan, dengan sebagian kecil data pelatihan memiliki pengaruh paling besar, namun pengaruhnya masih tersebar. Model ini mengilustrasikan proses generalisasi yang lebih kompleks dan bernuansa daripada sekadar menghitung contoh pelatihan individual di tingkat token. Fungsi pengaruh tidak hanya memberikan skor pengaruh bernilai skalar untuk setiap rangkaian pelatihan, namun juga memberikan wawasan tentang bagaimana pengaruh didistribusikan dalam jaringan saraf. Rata-rata, pengaruhnya didistribusikan secara merata di antara berbagai lapisan jaringan. Namun, untuk kueri pengaruh tertentu, pengaruh cenderung dilokalisasi ke bagian jaringan tertentu, dengan lapisan bawah dan atas menangkap informasi tekstual terperinci, dan lapisan tengah menangkap tingkat tematik yang lebih abstrak. Meskipun penelitian ini berfokus pada model terlatih, Anthropic juga ingin memperluas penelitiannya hingga penyempurnaan. Penyempurnaan melibatkan model pelatihan berdasarkan berbagai tujuan pembelajaran penguatan yang diawasi, yang dapat memberikan hasil dan tantangan yang mengejutkan. Kemampuan untuk melokalisasi pengaruh pada lapisan atau token tertentu juga membuka kemungkinan menghubungkan fungsi pengaruh dengan interpretasi mekanistik, yang pada akhirnya menentukan neuron dan sirkuit yang terlibat dalam pola generalisasi tertentu. Dengan mengungkap mekanisme di balik keluaran model dan pola generalisasi, peneliti dapat memprediksi kemampuan AI dengan lebih akurat dan menyesuaikan sistem AI dengan preferensi manusia. Hasil penelitian ini memiliki implikasi luas bagi pengembangan dan penerapan model bahasa skala besar di masa depan.

Sumber: Antropik

Bagikan artikel ini:

Tin tức mới nhất

Google Memperluas Fitur Keamanan AI Penasihat Iklan

23/4/26, 00.00

Google mengumumkan fitur keamanan baru untuk agen AI Ads Advisor-nya, yang bertujuan untuk meningkatkan efisiensi manajemen kampanye dan perlindungan akun.

Baca lebih lanjut

STATION Ai Memilih Lima Startup AI untuk Programnya

23/4/26, 00.00

STATION Ai mengumumkan terpilihnya lima startup untuk Program AI Boost dan mengadakan acara peluncuran pada 6 April 2026.

Baca lebih lanjut

Tujuh Perusahaan Mempelajari Operasi Pusat Data AI Terdistribusi

23/4/26, 00.00

J-POWER dan Hitachi, bersama dengan lima perusahaan lain, mengumumkan studi bersama tentang pergeseran beban kerja dan jaringan optik

Baca lebih lanjut

GAZAI Luncurkan Aplikasi Obrolan Karakter AI Anini

23/4/26, 00.00

GAZAI mengumumkan peluncuran resmi aplikasi obrolan karakter AI-nya, “anini”, untuk iOS dan Android.

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Pembuat Seni/Ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI

AI berteknologi besar

OpenAI/ChatGPT

AI generasi inovatif

AI generasi berbasis teks

AI inovatif Jepang

Dasar-dasar AI generatif

Petunjuk dasar aplikasi AI

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Berita terkini

Google Memperluas Fitur Keamanan AI Penasihat Iklan

23/4/26, 00.00

Google mengumumkan fitur keamanan baru untuk agen AI Ads Advisor-nya, yang bertujuan untuk meningkatkan efisiensi manajemen kampanye dan perlindungan akun.

Baca lebih lanjut

STATION Ai Memilih Lima Startup AI untuk Programnya

23/4/26, 00.00

STATION Ai mengumumkan terpilihnya lima startup untuk Program AI Boost dan mengadakan acara peluncuran pada 6 April 2026.

Baca lebih lanjut

Tujuh Perusahaan Mempelajari Operasi Pusat Data AI Terdistribusi

23/4/26, 00.00

J-POWER dan Hitachi, bersama dengan lima perusahaan lain, mengumumkan studi bersama tentang pergeseran beban kerja dan jaringan optik

Baca lebih lanjut

GAZAI Luncurkan Aplikasi Obrolan Karakter AI Anini

23/4/26, 00.00

GAZAI mengumumkan peluncuran resmi aplikasi obrolan karakter AI-nya, “anini”, untuk iOS dan Android.

Baca lebih lanjut