알츠하이머병 (AD) 진단 및 예후는 점점 더 머신러닝 (ML) 모델에 의존하고 있습니다. 이러한 모델이 좋은 결과를 제공하지만, 기술 전문 지식의 필요성과 신뢰할 수 있고 일관된 모델 설명의 부족으로 인해 임상 채택이 제한됩니다. SHAP (SHapley Additive exPlanations)는 AD 모델을 해석하는 데 일반적으로 사용되지만, 기존 연구는 고립된 작업에 대한 설명에 초점을 맞추는 경향이 있어 질병 단계, 모델 아키텍처 또는 예측 목표에 대한 강건성에 대한 증거는 적습니다. 본 논문은 (1) 기능 중요도와 SHAP 간의 모델 내 일관성 메트릭, (2) AD 경계에서의 SHAP 안정성, (3) 진단과 예후 간의 SHAP 교차 작업 일관성을 통합하여 설명의 일관성, 안정성 및 일관성을 측정하는 다단계 설명 가능성 프레임워크를 제안합니다. NACC 데이터셋에서 분류기를 최적화하기 위해 AutoML을 사용하여 표준 AD 진행 단계인 정상 통제 (NC), 경미한 인지 장애 (NCI) 및 AD를 포괄하는 네 개의 진단 및 네 개의 예후 모델을 훈련했습니다. 각 모델에 대해 SHAP 및 기능 중요도 (FI) 플롯을 생성했습니다. 그런 다음 상관 메트릭 (스피어만, 켄달), 상위-k 기능 오버랩 (Jaccard@10/20), SHAP 기호 일관성 및 도메인 수준 기여 비율을 사용하여 안정성을 평가했습니다. 결과는 인지 및 기능적 마커 (예: MEMORY, JUDGMENT, ORIENT, PAYATTN)가 진단 및 예후 모두에서 SHAP 설명을 지배함을 보여줍니다. 진단 및 예후 모델 간의 SHAP-SHAP 일관성은 모든 분류기에서 높았으며 (ρ = 0.61–0.94), 100% 기호 안정성과 설명의 크기에서 최소한의 변화 (평균 Δ|SHAP| < 0.03)를 보였습니다. 도메인 수준 기여도 역시 안정적으로 유지되었으며, 예후를 위한 유전적 특성의 증가는 최소한이었습니다. 이러한 결과는 SHAP 설명이 강건성과 이전 가능성에 대해 정량적으로 검증될 수 있음을 보여주며, 임상의들이 ML 예측을 더 신뢰할 수 있는 방식으로 해석할 수 있도록 합니다. 제안된 프레임워크는 AD 임상 환경에서 신뢰할 수 있는 ML 시스템을 배포하는 데 필요한 설명 가능성의 안정성과 일관성을 평가하기 위한 재현 가능한 방법론을 제공합니다.
Guillén et al. (Thu,)는 이 질문을 연구했습니다.