Tim NVIDIA AI mengungkap kelemahan besar dalam model bahasa 4/3880

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

Tim NVIDIA AI mengungkap kelemahan besar dalam model bahasa

Generatived

28/6/24, 05.14

Tim Merah AI NVIDIA telah mengidentifikasi kerentanan dalam cara model bahasa skala besar (LLM) memproses teks. Kerentanan ini dapat dimanfaatkan oleh penyerang untuk memanipulasi integritas sistem AI. Masalahnya terletak pada tokenizernya. Tokenizer mengubah teks menjadi rangkaian ID token yang dapat dipahami model, dan sebaliknya. Tim menemukan bahwa tanpa validasi yang memadai selama inisialisasi tokenizer, penyerang dapat mengubah pengkodean dan penguraian kode token, yang berpotensi menciptakan inkonsistensi antara input pengguna dan perhitungan LLM.

Risiko ini semakin meningkat karena setelah dilatih, tokenizer sering kali digunakan kembali di beberapa model dan tidak berubah saat model diperbarui. Tokenizer ini disimpan sebagai file teks biasa, sehingga setiap pengguna dengan hak istimewa yang memadai dapat mengakses dan mengeditnya. Kerentanan ini memungkinkan penyerang memetakan ulang nilai token dalam file konfigurasi tokenizer, yang berpotensi menyebabkan LLM salah menafsirkan perintah pengguna atau menghasilkan keluaran yang salah.

Misalnya, dengan memodifikasi file .json tokenizer, penyerang dapat mengubah token yang terkait dengan kata "tolak" menjadi kata "izinkan", yang secara efektif membalikkan arti perintah tersebut. Jenis operasi ini, yang disebut serangan pengkodean, dapat mempunyai implikasi serius terhadap keamanan sistem. Demikian pula, serangan decoding dapat mengubah keluaran model dan menyesatkan pengguna dan aplikasi hilir.

Untuk mengatasi ancaman ini, Tim Merah AI NVIDIA telah menerapkan langkah-langkah keamanan yang kuat, termasuk kontrol versi yang ketat dan audit tokenizer, pemeriksaan integritas runtime, dan pencatatan log input dan output yang terperinci. Langkah-langkah ini penting untuk menjaga keamanan dan keandalan LLM serta melindunginya dari potensi penyalahgunaan. Tim ini juga menekankan pentingnya kesadaran dan pendidikan seputar keamanan AI, dan wawasan lebih lanjut akan dibagikan dalam kursus NVIDIA Deep Learning Institute yang akan datang mengenai pembelajaran mesin adversarial. saus:

Sumber: Siaran pers

Bagikan artikel ini:

Tin tức mới nhất

ディスカバリーズAI学習データ評価開始

20/2/26, 00.00

ディスカバリーズ（東京都港区）は、企業の生産性向上を目指し「データスコア評価ソリューション」の提供を開始した。

Baca lebih lanjut

LayerX AIプラットフォーム導入UFJ

20/2/26, 00.00

LayerX（東京都中央区）が開発したAIプラットフォーム「Ai Workforce」が、三菱ＵＦＪ銀行に導入された。

Baca lebih lanjut

zeteoh空間AIで製造現場効率化

20/2/26, 00.00

zeteoh（東京都中央区）は、製造現場の「人・ロボット・資材」の動きをリアルタイムで把握する「空間AI」技術で特許を取得した。

Baca lebih lanjut

コレックHD子会社AIメディア改善実証

20/2/26, 00.00

コレックホールディングス（東京都豊島区）の子会社サンジュウナナド（東京都豊島区）は、生成AIを活用したメディア開発プロセスの高度化・迅速化プロジェクトの実証フェーズとして、Webメディアに生成AIコンテンツを導入し、UX改善効果を検証すると発表した。

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Pembuat Seni/Ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI