最近の研究では、AI 視覚システムに誤解を与えることを目的としたデジタル画像の微妙な操作も、人間の認識を揺るがす可能性があることが明らかになりました。研究者らは、人間と AI の両方が、AI モデルによる誤分類を引き起こすためにわずかに変更されたこれらの「敵対的な画像」の影響を受ける可能性があることを発見しました。 Nature Communicationsに掲載されたこの研究結果は、これまで人間には知覚できないと考えられていたこれらの摂動が、特定の条件下では実際に人間の判断に影響を与える可能性があることを示唆している。

実験では、AIを欺くために細かく調整された画像のペアを人間の被験者に提示することが行われた。参加者は、どちらの画像も問題の物体に目に見えて似ていないにもかかわらず、どちらの画像が特定の物体によりよく似ているかを特定するよう求められました。驚くべきことに、その結​​果は、人々が常に敵対的な修正によってバイアスを受けており、偶然に予想されるよりも頻繁に AI がだまされて誤分類された画像を選択していることを示しました。

この現象は、AI の安全性とセキュリティの分野に重大な影響を及ぼす可能性があり、この研究は人間の知覚も、程度は低いとはいえ、機械の視覚を欺く可能性がある同じトリックの影響を受けないわけではないことを示していると述べている。また、AI と人間の認知の両方に対するテクノロジーの影響に関する継続的な研究の必要性も強調し、より安全で確実な AI テクノロジーを生み出す上での認知科学と神経科学の役割を強調している。

ソース:DeepMind Blog