Key points are not available for this paper at this time.
민감한 데이터, 예를 들어 의료 기록과 상호작용하는 알고리즘을 설계할 때 많은 과제가 존재합니다. 이러한 도전 중 하나는 프라이버시입니다. 하지만 프라이버시, 유용성(모델 정확도), 그리고 공정성 간에는 긴장이 존재합니다. 프라이버시 보호를 가능하게 하기 위해 일반화 및 억제와 같은 비식별화 기법이 제안되었지만, 이는 공정성과 유용성에 특히 비용이 발생합니다. 최근 알고리즘 공정성에 관한 연구는 공정성을 '유사' 입력에 대한 유사한 출력 보장으로 정의하고 있으며, 이는 비식별화와 관련하여 논의됩니다. 본 연구는 프라이버시, 공정성 및 유용성 간의 균형을 조사합니다. 반면, 다른 연구는 프라이버시와 전체 유용성 간의 균형을 조사합니다. 본 연구에서는 유용성과 공정성 모두에 대한 k-익명성과 차별적 프라이버시 두 가지 비식별화 기법의 영향을 살펴봅니다. 우리는 프라이버시-유용성 및 프라이버시-공정성 간의 균형을 계산하기 위한 두 가지 측정을 제안합니다. 다른 연구들은 유용성에 대한 프라이버시에 대한 보장을 제공했으나, 본 연구는 설정된 비식별화 수준에서의 균형에 초점을 맞추고 이러한 보장에 의존합니다. 우리는 다양한 특성을 가진 데이터에 대한 비식별화의 영향을 논의합니다: 클래스 불균형 및 결과 불균형. 우리는 이러한 영향을 합성 데이터셋과 실제 데이터셋에서 평가했습니다. 사례 연구로 의료 지출 패널 조사 데이터셋을 분석했습니다.
Chester et al. (화요일) 이 질문을 연구했습니다.