top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

Tim NVIDIA AI mengungkap kelemahan besar dalam model bahasa

Generatived

28/6/24, 05.14

Tim Merah AI NVIDIA telah mengidentifikasi kerentanan dalam cara model bahasa skala besar (LLM) memproses teks. Kerentanan ini dapat dimanfaatkan oleh penyerang untuk memanipulasi integritas sistem AI. Masalahnya terletak pada tokenizernya. Tokenizer mengubah teks menjadi rangkaian ID token yang dapat dipahami model, dan sebaliknya. Tim menemukan bahwa tanpa validasi yang memadai selama inisialisasi tokenizer, penyerang dapat mengubah pengkodean dan penguraian kode token, yang berpotensi menciptakan inkonsistensi antara input pengguna dan perhitungan LLM.

Risiko ini semakin meningkat karena setelah dilatih, tokenizer sering kali digunakan kembali di beberapa model dan tidak berubah saat model diperbarui. Tokenizer ini disimpan sebagai file teks biasa, sehingga setiap pengguna dengan hak istimewa yang memadai dapat mengakses dan mengeditnya. Kerentanan ini memungkinkan penyerang memetakan ulang nilai token dalam file konfigurasi tokenizer, yang berpotensi menyebabkan LLM salah menafsirkan perintah pengguna atau menghasilkan keluaran yang salah.

Misalnya, dengan memodifikasi file .json tokenizer, penyerang dapat mengubah token yang terkait dengan kata "tolak" menjadi kata "izinkan", yang secara efektif membalikkan arti perintah tersebut. Jenis operasi ini, yang disebut serangan pengkodean, dapat mempunyai implikasi serius terhadap keamanan sistem. Demikian pula, serangan decoding dapat mengubah keluaran model dan menyesatkan pengguna dan aplikasi hilir.

Untuk mengatasi ancaman ini, Tim Merah AI NVIDIA telah menerapkan langkah-langkah keamanan yang kuat, termasuk kontrol versi yang ketat dan audit tokenizer, pemeriksaan integritas runtime, dan pencatatan log input dan output yang terperinci. Langkah-langkah ini penting untuk menjaga keamanan dan keandalan LLM serta melindunginya dari potensi penyalahgunaan. Tim ini juga menekankan pentingnya kesadaran dan pendidikan seputar keamanan AI, dan wawasan lebih lanjut akan dibagikan dalam kursus NVIDIA Deep Learning Institute yang akan datang mengenai pembelajaran mesin adversarial. saus:

Bagikan artikel ini:

Tin tức mới nhất
ディスカバリーズAI学習データ評価開��始

ディスカバリーズAI学習データ評価開始

20/2/26, 00.00

ディスカバリーズ(東京都港区)は、企業の生産性向上を目指し「データスコア評価ソリューション」の提供を開始した。

LayerX AIプラットフォーム導入UFJ

LayerX AIプラットフォーム導入UFJ

20/2/26, 00.00

LayerX(東京都中央区)が開発したAIプラットフォーム「Ai Workforce」が、三菱UFJ銀行に導入された。

zeteoh空間AIで製造現場効率化

zeteoh空間AIで製造現場効率化

20/2/26, 00.00

zeteoh(東京都中央区)は、製造現場の「人・ロボット・資材」の動きをリアルタイムで把握する「空間AI」技術で特許を取得した。

コレックHD子会社AIメディア改善実証

コレックHD子会社AIメディア改善実証

20/2/26, 00.00

コレックホールディングス(東京都豊島区)の子会社サンジュウナナド(東京都豊島区)は、生成AIを活用したメディア開発プロセスの高度化・迅速化プロジェクトの実証フェーズとして、Webメディアに生成AIコンテンツを導入し、UX改善効果を検証すると発表した。

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
ディスカバリーズAI学習データ評価開始

ディスカバリーズAI学習データ評価開始

20/2/26, 00.00

ディスカバリーズ(東京都港区)は、企業の生産性向上を目指し「データスコア評価ソリューション」の提供を開始した。

LayerX AIプラットフォーム導入UFJ

LayerX AIプラットフォーム導入UFJ

20/2/26, 00.00

LayerX(東京都中央区)が開発したAIプラットフォーム「Ai Workforce」が、三菱UFJ銀行に導入された。

zeteoh空間AIで製造現場効率化

zeteoh空間AIで製造現場効率化

20/2/26, 00.00

zeteoh(東京都中央区)は、製造現場の「人・ロボット・資材」の動きをリアルタイムで把握する「空間AI」技術で特許を取得した。

コレックHD子会社AIメディア改善実証

コレックHD子会社AIメディア改善実証

20/2/26, 00.00

コレックホールディングス(東京都豊島区)の子会社サンジュウナナド(東京都豊島区)は、生成AIを活用したメディア開発プロセスの高度化・迅速化プロジェクトの実証フェーズとして、Webメディアに生成AIコンテンツを導入し、UX改善効果を検証すると発表した。

bottom of page