Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA xác định các mối đe dọa bảo mật mới đối với AI đa phương thức

Generatived

0:00 4/8/25

Nhóm AI Red Team của NVIDIA tích cực mô phỏng các cuộc tấn công trong thế giới thực để xác định các mối đe dọa tiềm ẩn đối với hệ thống AI, đặc biệt tập trung vào các lỗ hổng trong AI sinh sản và đa phương thức. Nghiên cứu của họ không đưa ra giải pháp tức thời mà chỉ nêu bật những lĩnh vực cần nỗ lực chung để tăng cường bảo mật.

Nhóm đã giới thiệu một loại tấn công mới, tiêm nhắc đa phương thức, bỏ qua ngôn ngữ tự nhiên và thao túng hệ thống tác tử bằng cách sử dụng đầu vào trực quan biểu tượng, chẳng hạn như chuỗi biểu tượng cảm xúc hoặc câu đố ghép hình. Cách tiếp cận này vượt qua bộ lọc đầu vào truyền thống, cho thấy cần phải có các biện pháp phòng thủ ở cấp độ đầu ra để bảo mật quy trình làm việc của AI.

Theo truyền thống, các cuộc tấn công tiêm nhắc đa phương thức thao túng hệ thống AI bằng cách nhúng văn bản độc hại vào hình ảnh và xử lý chúng thông qua một đường ống văn bản. Tuy nhiên, với sự xuất hiện của các mô hình như dòng O của OpenAI, xử lý các phương thức thành các vectơ nhúng và thực hiện giải mã chung, các kỹ thuật tấn công mới đã xuất hiện, khai thác sự tích hợp trực tiếp của các đầu vào đa phương thức mà không cần tải trọng văn bản ẩn.

Những tiến bộ trong các mô hình đa phương thức, đặc biệt là các kiến trúc hợp nhất ban đầu như Meta Llama 4, đã cho phép suy luận liên phương thức tinh vi hơn bằng cách tích hợp liền mạch văn bản và hình ảnh trong một không gian tiềm ẩn chung. Sự tiến bộ này đã tạo điều kiện cho các loại hình tấn công mới, cho phép kẻ tấn công vượt qua các biện pháp đối phó bảo mật dựa trên văn bản truyền thống bằng cách tạo ra các chuỗi hình ảnh mã hóa trực quan các hướng dẫn.

Để ứng phó với những mối đe dọa mới này, NVIDIA đề xuất một sự thay đổi trong các chiến lược bảo mật AI. Thay vì chỉ dựa vào lọc đầu vào, các tổ chức nên tập trung vào việc triển khai các bộ lọc đầu ra thích ứng, phòng thủ nhiều lớp và phân tích liên phương thức ngữ nghĩa để phát hiện và giảm thiểu các cuộc tấn công. Việc liên tục điều chỉnh các biện pháp phòng thủ này thông qua các bài tập nhóm đỏ và vòng lặp phản hồi là điều cần thiết để đảm bảo an toàn và khả năng phục hồi của các hệ thống AI trong quá trình sản xuất.

Nguồn: Blog nhà phát triển NVIDIA

Chia sẻ bài viết này:

Tin tức mới nhất

Tính năng hỗ trợ AI mới của OPERe PokeSapo

0:00 16/2/26

OPERe (Minato-ku, Tokyo) đã bổ sung chức năng mới "AI Window" vào hệ thống giao tiếp bệnh nhân "PokeSapo".

đọc thêm

Dịch vụ VPS tự động hóa Xserver AI

0:00 16/2/26

Xserver (Kita-ku, Osaka) đã bắt đầu cung cấp ứng dụng OpenClaw trên dịch vụ VPS của mình, XServer VPS.

đọc thêm

Cập nhật lớn về phỏng vấn AI của PeopleX

0:00 16/2/26

PeopleX (Shinjuku-ku, Tokyo), một công ty cung cấp dịch vụ hỗ trợ nhân sự dựa trên trí tuệ nhân tạo (AI), đã thông báo về việc cập nhật lớn cho "Chế độ AI đàm thoại I5"

đọc thêm

mpathic mở rộng các công cụ an toàn AI cho các nhà phát triển

0:00 16/2/26

Công ty an toàn AI mpathic có trụ sở tại Seattle đã thông báo mở rộng hoạt động sang hỗ trợ các nhà phát triển mô hình và ứng dụng nền tảng sử dụng mô hình ngôn ngữ quy mô lớn (LLM).

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Tính năng hỗ trợ AI mới của OPERe PokeSapo

0:00 16/2/26

OPERe (Minato-ku, Tokyo) đã bổ sung chức năng mới "AI Window" vào hệ thống giao tiếp bệnh nhân "PokeSapo".

đọc thêm

Dịch vụ VPS tự động hóa Xserver AI

0:00 16/2/26

Xserver (Kita-ku, Osaka) đã bắt đầu cung cấp ứng dụng OpenClaw trên dịch vụ VPS của mình, XServer VPS.

đọc thêm

Cập nhật lớn về phỏng vấn AI của PeopleX

0:00 16/2/26

PeopleX (Shinjuku-ku, Tokyo), một công ty cung cấp dịch vụ hỗ trợ nhân sự dựa trên trí tuệ nhân tạo (AI), đã thông báo về việc cập nhật lớn cho "Chế độ AI đàm thoại I5"

đọc thêm

mpathic mở rộng các công cụ an toàn AI cho các nhà phát triển

0:00 16/2/26

Công ty an toàn AI mpathic có trụ sở tại Seattle đã thông báo mở rộng hoạt động sang hỗ trợ các nhà phát triển mô hình và ứng dụng nền tảng sử dụng mô hình ngôn ngữ quy mô lớn (LLM).

đọc thêm