Key points are not available for this paper at this time.
배경 의학 영상 데이터의 양이 계속 증가함에 따라 임상의사를 지원하는 알고리즘에 대한 수요가 증가하고 있습니다. 비감독 이상 탐지(UAD) 모델은 질병 탐지의 중요한 첫 단계를 지원할 것으로 약속합니다. 이전 연구들이 의료 분야에서 감독 모델의 공정성을 철저히 탐구했지만, UAD에 대해서는 지금까지 탐구되지 않았습니다. 방법 이 연구에서는 하위 그룹에 대한 데이터셋 구성에 따라 UAD 모델의 성능이 여러 보호 변수를 따라 어떻게 나타나는지를 평가했습니다. 대규모 공개 흉부 X선 데이터셋 세 가지를 이용하여 두 가지 최첨단 UAD 모델을 사용하여 실험을 검증했습니다. 마지막으로 머신러닝의 공정성을 정량화하는 데 도움을 주는 하위 그룹-AUROC (sAUROC)를 소개했습니다. 결과 우리의 실험은 훈련 데이터셋 구성에 대한 실증적 "공정성 법칙"(Transformers의 "스케일링 법칙"과 유사)을 밝혀냈습니다: 하위 집단 내의 이상 탐지 성능과 훈련 데이터에서의 그 표현 간의 선형 관계입니다. 우리의 연구는 균형 잡힌 훈련 데이터의 경우에도 성능 격차를 드러내었고, 여러 악영향을 받는 그룹과 관련된 피험자에 대한 성능 하락을 악화시키는 복합 효과를 발견했습니다. 해석 우리의 연구는 특정 인구 통계 하위 그룹에 대한 UAD 모델의 성능 격차를 정량화했습니다. 중요하게도, 우리는 이러한 불공정함이 단순한 균형 잡힌 표현으로 완화될 수 없음을 보여주었습니다. 대신, 일부 하위 그룹의 표현은 다른 그룹보다 UAD 모델이 배우기 더 어렵다는 것으로 보입니다. 우리의 연구에서 발견된 실증적 "공정성 법칙"은 UAD 모델의 성능 격차를 쉽게 추정할 수 있게 하고, 가장 바람직한 데이터셋 구성을 결정하는 데 도움을 줍니다. 자금 유럽연구위원회 Deep4MI.
Meissen 외. (금요일,) 이 질문에 대해 연구했습니다.