Key points are not available for this paper at this time.
반사실 설명(Counterfactual Explanations, CEs)은 설명 가능한 AI 연구에서 주요 패러다임으로 부상하였으며, 기계 학습 모델의 결정에 영향을 받은 사용자에게 해결책 권고를 제공한다. 그러나 기존 방법으로 찾은 CEs는 생성된 모델의 매개변수가 약간만 변경되어도 종종 무효가 된다. 문헌에는 모델 변경에 따른 CEs의 전면적인 강인성 보장을 제공하는 방법이 부족하며, 기존의 CEs 강인성 향상 방법은 대체로 휴리스틱에 의존하고, 강인성 평가는 제한된 수의 재학습된 모델을 사용한 경험적 방법에 그친다. 이 간극을 메우기 위해, 우리는 파라메트릭 기계 학습 모델에 대한 새로운 구간 추상화 기법을 제안하며, 이를 통해 무한에 가까운 합리적 모델 변경 집합 아래에서 CEs의 증명 가능한 강인성 보장을 획득할 수 있다. 이 아이디어를 바탕으로, 이진 및 다중 클래스 분류 설정 모두에서 -강인성이라는 CEs 강인성 개념을 정형화한다. 우리는 혼합 정수 선형 계획법(Mixed Integer Linear Programming)을 기반으로 -강인성을 검증하는 절차를 제시하며, 이를 활용해 -강인한 CEs를 생성하는 알고리즘도 제안한다. 신경망과 로지스틱 회귀 모델을 포함한 광범위한 실험 연구에서, 우리 접근법의 실용적 적용 가능성을 입증하였다. 또한, 본 방법에서 적절한 하이퍼파라미터를 결정하기 위한 두 가지 전략을 논의하였으며, 열한 가지 방법으로 생성된 CEs를 정량적으로 벤치마킹해, 강인한 CEs를 찾는 데 있어 우리 알고리즘의 효과성을 부각시켰다.
Jiang 등(Sun,)이 이 질문을 연구했다.