May 24, 2024Open Access

어댑터 인증: 분류기 적대적 강건성 인증을 가능하게 하고 향상시키기

Key Points

Key points are not available for this paper at this time.

Abstract

무작위 스무딩은 깊은 분류기에서 l₏-노름 적대적 변동에 대한 인증된 강건성을 달성하기 위한 주요 방법이 되었습니다. 가우시안 노이즈와 적대적 훈련을 이용한 데이터 증대와 같은 현재의 인증 강건성 달성 방법은 서로 다른 가우시안 노이즈 수준에 맞추기 위해 대규모 모델을 조정하는 비싼 훈련 절차를 필요로 하며, 따라서 고성능으로 사전 훈련된 신경망을 활용할 수 없습니다. 본 연구에서는 분류기 적대적 강건성의 인증을 가능하게 하고 향상시키는 새로운 인증 어댑터 프레임워크(CAF)를 소개합니다. 우리의 접근법은 기본 훈련 알고리즘이나 특징 추출기에 대한 가정을 최소화하여 다양한 특징 추출기 아키텍처(예: 합성곱 신경망 또는 비전 변환기) 및 스무딩 알고리즘에 널리 적용될 수 있습니다. 우리는 CAF가 (a) 클린 데이터셋에서 사전 훈련된 인증되지 않은 모델에서 인증을 가능하게 하고 (b) CIFAR-10 및 ImageNet의 여러 반경에서 무작위 스무딩과 SmoothAdv를 통해 인증된 분류기의 성능을 상당히 향상시킨다는 것을 보여줍니다. CAF가 무작위 혹은 제거된 스무딩을 기반으로 하는 방법들과 비교했을 때 개선된 인증 정확도를 달성하며, 인증 어댑터 하이퍼파라미터에 대해 민감하지 않다는 것을 입증합니다. 마지막으로 어댑터의 앙상블이 단일 사전 훈련된 특징 추출기가 다양한 노이즈 변동 범위에 맞서 방어할 수 있도록 한다는 것을 보여줍니다.

어댑터 인증: 분류기 적대적 강건성 인증을 가능하게 하고 향상시키기

Key Points

Abstract

Cite This Study