top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA AI phát hiện lỗ hổng tấn công nhận thức đa phương thức

Generatived

0:00 11/8/25

Nhóm NVIDIA AI Red Team đã và đang tích cực điều tra các lỗ hổng trong các mô hình AI đa phương thức, vốn ngày càng có khả năng suy luận và hành động tự chủ. Nghiên cứu của họ cho thấy các phương thức tấn công đang phát triển cùng với sự tiến bộ của AI. Mặc dù việc chèn lời nhắc bằng văn bản ban đầu được sử dụng để thao túng đầu ra của AI, nhưng khi các hệ thống AI trở nên tinh vi hơn, kẻ tấn công đã bắt đầu nhúng các lệnh độc hại vào hình ảnh và âm thanh. Mối đe dọa mới nhất là tấn công suy luận đa phương thức. Kẻ tấn công tạo ra các tác vụ nhận thức khai thác khả năng giải quyết vấn đề của AI, có khả năng dẫn đến việc thực thi các lệnh độc hại.

Phát hiện của nhóm cho thấy các cuộc tấn công nhận thức đa phương thức này nhắm vào quá trình hợp nhất ban đầu của các mô hình AI, quá trình kết hợp các đầu vào khác nhau như văn bản, hình ảnh và âm thanh. Bằng cách nhúng một tải trọng vào tác vụ nhận thức, kẻ tấn công có thể thao túng cơ chế suy luận của mô hình và biến quy trình tính toán của nó thành một đường dẫn bị xâm phạm. Cách tiếp cận này vượt qua các bộ lọc đầu vào truyền thống và đòi hỏi phải đánh giá lại bảo mật AI ở cấp độ kiến trúc, tập trung vào chính quá trình suy luận.

Các nhà nghiên cứu đã đưa ra một ví dụ về một cuộc tấn công giải đố trượt (sliding puzzle) nhắm vào mô hình Gemini 2.5 Pro. Kẻ tấn công có thể phân tán các lệnh trong toàn bộ câu đố mà AI phải giải để tái tạo các lệnh độc hại. Kỹ thuật này không chỉ tránh né các công cụ phân tích tĩnh mà còn diễn giải các lệnh như là kết quả logic của nhiệm vụ giải quyết vấn đề của AI. Nghiên cứu này nhấn mạnh sự cần thiết của các chiến lược phòng thủ mới, vượt ra ngoài việc xác thực đầu vào và giải quyết quá trình suy luận của các hệ thống AI.

Những phát hiện này cho thấy các hệ thống AI hiện tại dễ bị tấn công khai thác khả năng suy luận của chúng và có những tác động quan trọng. Nghiên cứu này nhấn mạnh tầm quan trọng của việc phát triển các biện pháp bảo mật mới có thể xác minh quá trình suy luận, triển khai các hộp cát tính toán và thiết lập các kiến trúc bảo mật tập trung vào đầu ra. Khi AI ngày càng được tích hợp sâu hơn vào nhiều lĩnh vực khác nhau, nhu cầu bảo vệ chống lại các cuộc tấn công tinh vi này ngày càng tăng, đòi hỏi phải thay đổi cách tiếp cận bảo mật AI.

Chia sẻ bài viết này:

Tin tức mới nhất
TIMEWELL: Ti�ếp tục hỗ trợ sự phát triển của các doanh nhân trẻ.

TIMEWELL: Tiếp tục hỗ trợ sự phát triển của các doanh nhân trẻ.

0:00 17/2/26

TIMEWELL (Yokohama, tỉnh Kanagawa) đã được chọn làm đơn vị mở rộng cho dự án "TOKYO SUTEAM" của Tokyo.

Đã thêm các tính năng mới vào Rakuten LinkSurge

Đã thêm các tính năng mới vào Rakuten LinkSurge

0:00 17/2/26

LinkShare Japan, một thành viên của tập đoàn Rakuten, đã bổ sung chức năng bảng điều khiển vào LinkSurge, phần mềm được phát triển với sự hợp tác của Benji.

Hỗ trợ Avatar AI đám mây khách hàng

Hỗ trợ Avatar AI đám mây khách hàng

0:00 17/2/26

Công ty Customer Cloud (Shibuya-ku, Tokyo) đã ra mắt dịch vụ sử dụng trí tuệ Generative AI) và công nghệ avatar AI để hỗ trợ phát triển avatar kỹ thuật số cho các nghệ sĩ và người nổi tiếng.

Thí nghiệm trình diễn công nghệ sạc xe điện Verbex ENEOS bằng trí tuệ nhân tạo bắt đầu.

Thí nghiệm trình diễn công nghệ sạc xe điện Verbex ENEOS bằng trí tuệ nhân tạo bắt đầu.

0:00 17/2/26

Verbex đang hợp tác với ENEOS Holdings và ENEOS để triển khai dự án thí điểm nhằm cải thiện chất lượng dịch vụ khách hàng cho dịch vụ sạc xe điện.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
TIMEWELL: Tiếp tục hỗ trợ sự phát triển của các doanh nhân trẻ.

TIMEWELL: Tiếp tục hỗ trợ sự phát triển của các doanh nhân trẻ.

0:00 17/2/26

TIMEWELL (Yokohama, tỉnh Kanagawa) đã được chọn làm đơn vị mở rộng cho dự án "TOKYO SUTEAM" của Tokyo.

Đã thêm các tính năng mới vào Rakuten LinkSurge

Đã thêm các tính năng mới vào Rakuten LinkSurge

0:00 17/2/26

LinkShare Japan, một thành viên của tập đoàn Rakuten, đã bổ sung chức năng bảng điều khiển vào LinkSurge, phần mềm được phát triển với sự hợp tác của Benji.

Hỗ trợ Avatar AI đám mây khách hàng

Hỗ trợ Avatar AI đám mây khách hàng

0:00 17/2/26

Công ty Customer Cloud (Shibuya-ku, Tokyo) đã ra mắt dịch vụ sử dụng trí tuệ Generative AI) và công nghệ avatar AI để hỗ trợ phát triển avatar kỹ thuật số cho các nghệ sĩ và người nổi tiếng.

Thí nghiệm trình diễn công nghệ sạc xe điện Verbex ENEOS bằng trí tuệ nhân tạo bắt đầu.

Thí nghiệm trình diễn công nghệ sạc xe điện Verbex ENEOS bằng trí tuệ nhân tạo bắt đầu.

0:00 17/2/26

Verbex đang hợp tác với ENEOS Holdings và ENEOS để triển khai dự án thí điểm nhằm cải thiện chất lượng dịch vụ khách hàng cho dịch vụ sạc xe điện.

bottom of page