Key points are not available for this paper at this time.
コンピュータビジョンタスクに対する高性能なソリューションを提供しているにもかかわらず、深層ニューラルネットワーク(DNN)モデルは敵対的攻撃に対して非常に脆弱であることが証明されています。現在の防御は主に既知の攻撃に焦点を当てていますが、未知の攻撃に対する敵対的ロバスト性は深刻に見落とされています。また、一般的に使用される適応学習やファインチューニング技術は、展開時には本質的にゼロショットの問題であるため、敵対的防御には不適切です。したがって、この課題に取り組むために、攻撃に依存しない防御手法であるメタ不変防御(MID)を提案します。具体的には、敵対的攻撃のさまざまな組み合わせが手動で構築された攻撃者プールからランダムにサンプリングされ、未知の攻撃に対する異なる防御タスクを構成します。このプロセスにおいて、学生エンコーダーはマルチコンシステンシー蒸留によって攻撃不変な特徴をメタ原則に基づいて学習します。提案されたMIDには二つの利点があります:1) 有害サンプルと無害サンプルの間でピクセル、特徴、予測レベルからの完全な蒸留が攻撃不変性の発見を助けます。2) モデルは、高レベルの画像分類における知覚できない敵対的摂動に対するロバスト性と、低レベルの堅牢な画像再生における攻撃抑制を同時に実現します。ImageNetなどの多数のベンチマークにおける理論的および実証的研究は、様々な攻撃下でのMIDの一般化可能なロバスト性と優位性を検証しています。
Zhang et al. (Mon,) はこの問題を研究しました。