Penelitian AI mengungkap kerentanan tersembunyi dalam model bahasa. 8/3867

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

Penelitian AI mengungkap kerentanan tersembunyi dalam model bahasa.

Generatived

6/2/26, 00.00

Penelitian baru menghadirkan metode inovatif untuk mengidentifikasi kerentanan dalam model bahasa terbuka, yang sangat penting untuk menjaga integritas sistem AI. Para peneliti menemukan bahwa perilaku "pintu belakang" dalam model AI ini dapat diaktifkan dalam kondisi tertentu, sehingga menimbulkan risiko terhadap keamanan sistem. Penelitian ini menyoroti pentingnya strategi pertahanan yang kuat, termasuk proses pembangunan yang aman, evaluasi menyeluruh, dan pemantauan ketat, untuk memastikan penerapan AI yang andal dan aman.

Studi ini mengeksplorasi kompleksitas perusakan model bahasa secara detail, membedakan antara manipulasi kode dan peracunan model. Meskipun perusakan kode merupakan ancaman keamanan yang diakui, peracunan model lebih halus, melibatkan penyisipan perilaku berbahaya ke dalam bobot model selama pelatihan. Hal ini dapat menyebabkan model yang beroperasi normal hingga dipicu oleh frasa tertentu untuk menjalankan perilaku jahat. Temuan studi ini sangat penting untuk mengembangkan alat untuk mendeteksi dan mengurangi risiko ini serta meningkatkan keandalan teknologi AI.

Tim peneliti mengidentifikasi indikator-indikator kunci yang menunjukkan adanya celah keamanan (backdoor) dalam model bahasa, termasuk pola perhatian yang khas dan perubahan entropi keluaran ketika dipicu, serta kecenderungan model yang terkontaminasi untuk secara tidak sengaja membocorkan data latihannya sendiri. Lebih lanjut, penelitian menemukan bahwa celah keamanan sering diaktifkan oleh variasi pemicu yang dimaksudkan, memperluas jangkauan deteksi. Berdasarkan temuan ini, dikembangkan pemindai praktis yang dapat mengidentifikasi potensi celah keamanan tanpa memerlukan pelatihan model tambahan atau pengetahuan sebelumnya tentang perilaku celah keamanan tersebut.

"Penelitian ini mengakui beberapa keterbatasan, seperti ketidakmampuan pemindai untuk diterapkan pada model-model eksklusif yang hanya dapat diakses melalui API dan fokus saat ini pada pintu belakang keluaran deterministik. Terlepas dari tantangan-tantangan ini, penelitian ini mewakili kemajuan signifikan dalam keamanan AI dan menyediakan alat yang dapat diintegrasikan ke dalam strategi pertahanan yang lebih luas. Para peneliti berharap dapat mendorong kolaborasi dalam komunitas AI untuk lebih menyempurnakan dan menerapkan teknik deteksi ini, memastikan pengembangan sistem AI yang aman dan andal secara berkelanjutan."

Sumber: Berita terbaru - Sumber, Microsoft

Bagikan artikel ini:

Tin tức mới nhất

Dukungan Rekaman Pengajaran AI untuk Taman Kanak-kanak VISH

5/2/26, 00.00

VISH (Nagoya, Prefektur Aichi) akan mulai menawarkan versi beta dari fungsi pendukung pembuatan catatan pengajaran menggunakan Generative AI untuk sistem TIK-nya bagi taman kanak-kanak dan pusat penitipan anak

Baca lebih lanjut

Layanan pencarian desain AI Aztec diluncurkan.

5/2/26, 00.00

Aztec (kantor pusat) telah mulai menawarkan "layanan pencarian desain" sebagai respons terhadap meningkatnya risiko masalah desain akibat AI.

Baca lebih lanjut

Kemitraan Yamagata Shimbun dan Niigata Nippo AI

5/2/26, 00.00

Yamagata Shimbun (Kota Yamagata) telah menandatangani "Perjanjian Kemitraan Generative AI Kolaboratif Regional" dengan Institut Penelitian Generative AI Niigata Nippo (Kota Niigata).

Baca lebih lanjut

Monitor Rekrutmen New Value Frontier Dolphin V3.0

5/2/26, 00.00

New Value Frontier (Ebisu, Shibuya-ku, Tokyo) telah mulai merekrut fasilitas pemantau untuk versi 3.0 dari Dolphin, asisten AI yang dikembangkan untuk industri pernikahan dan perhotelan, yang terbatas pada 23 distrik di Tokyo.

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Pembuat Seni/Ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI

AI berteknologi besar

OpenAI/ChatGPT

AI generasi inovatif

AI generasi berbasis teks

AI inovatif Jepang

Dasar-dasar AI generatif

Petunjuk dasar aplikasi AI

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Berita terkini

Dukungan Rekaman Pengajaran AI untuk Taman Kanak-kanak VISH

5/2/26, 00.00

VISH (Nagoya, Prefektur Aichi) akan mulai menawarkan versi beta dari fungsi pendukung pembuatan catatan pengajaran menggunakan Generative AI untuk sistem TIK-nya bagi taman kanak-kanak dan pusat penitipan anak

Baca lebih lanjut

Layanan pencarian desain AI Aztec diluncurkan.

5/2/26, 00.00

Aztec (kantor pusat) telah mulai menawarkan "layanan pencarian desain" sebagai respons terhadap meningkatnya risiko masalah desain akibat AI.

Baca lebih lanjut

Kemitraan Yamagata Shimbun dan Niigata Nippo AI

5/2/26, 00.00

Yamagata Shimbun (Kota Yamagata) telah menandatangani "Perjanjian Kemitraan Generative AI Kolaboratif Regional" dengan Institut Penelitian Generative AI Niigata Nippo (Kota Niigata).

Baca lebih lanjut

Monitor Rekrutmen New Value Frontier Dolphin V3.0

5/2/26, 00.00

New Value Frontier (Ebisu, Shibuya-ku, Tokyo) telah mulai merekrut fasilitas pemantau untuk versi 3.0 dari Dolphin, asisten AI yang dikembangkan untuk industri pernikahan dan perhotelan, yang terbatas pada 23 distrik di Tokyo.

Baca lebih lanjut