Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

OpenAI ra mắt chương trình thưởng tìm lỗi an toàn AI mới
Generatived
0:00 27/3/26
OpenAI vừa công bố khởi động chương trình Thưởng Tìm Lỗi An Toàn mới nhằm mục đích xác định và giảm thiểu các hành vi lạm dụng tiềm ẩn và rủi ro an toàn trong các ứng dụng AI. Sáng kiến này hướng đến việc duy trì tính bảo mật của hệ thống bằng cách giải quyết các vấn đề có thể dẫn đến thiệt hại trong thế giới thực, ngay cả khi chúng không được coi là lỗ hổng bảo mật. Chương trình khuyến khích sự hợp tác với các nhà nghiên cứu để xác định và giải quyết các mối lo ngại có thể không được nhận biết theo cách truyền thống là mối đe dọa an ninh nhưng vẫn tiềm ẩn những nguy hiểm đáng kể.
Chương trình sẽ hoạt động song song với chương trình Thưởng Tìm Lỗi An Toàn hiện có của OpenAI, tập trung vào các kịch bản an toàn cụ thể liên quan đến AI. Điều này bao gồm các rủi ro về hành vi tác nhân, trong đó các tác nhân AI có thể bị thao túng để thực hiện các hành động gây hại hoặc làm rò rỉ dữ liệu nhạy cảm, và việc lộ thông tin độc quyền của OpenAI. Ngoài ra, chương trình sẽ giải quyết các lỗ hổng làm tổn hại đến tính toàn vẹn của tài khoản và nền tảng, chẳng hạn như vượt qua các biện pháp kiểm soát chống tự động hóa hoặc truy cập các tính năng trái phép.
Các nhà nghiên cứu tham gia chương trình Thưởng Tìm Lỗi An Toàn được khuyến khích báo cáo các vấn đề có thể gây hại trực tiếp cho người dùng, với khả năng nhận được phần thưởng cho những phát hiện của họ tùy từng trường hợp. Tuy nhiên, chương trình này đặt ra những giới hạn rõ ràng, loại trừ các hành vi lách luật chính sách nội dung chung chung mà không chứng minh được tác động rõ rệt đến an toàn hoặc khả năng gây hại. OpenAI cũng tổ chức các chiến dịch tìm lỗi bảo mật riêng tư cho các loại hành vi gây hại cụ thể và mời các nhà nghiên cứu đăng ký tham gia các sáng kiến chuyên biệt này.
