대출 연체 예측은 금융 위험 관리의 핵심 문제로서 신용 결정과 자본 배분 효율성에 직접적인 영향을 미칩니다. 본 연구는 20만 건의 익명화된 대출 기록을 바탕으로 하였으며, 신용 기록 길이 표준화, 이상치 수정과 같은 특성 공학과 SMOTE 오버샘플링 기법을 사용하여 데이터 품질을 최적화하였습니다. XGBoost와 LightGBM 같은 알고리즘의 성능을 비교하였고, SHAP 및 LIME 기법을 활용해 모델 해석 가능성을 향상시켰습니다. 결과는 XGBoost가 최고의 성능(test set AUC=0.89)을 기록하여 로지스틱 회귀(AUC=0.62)를 크게 능가함을 보여줍니다. 주요 위험 요소로는 신용 점수(SHAP 평균 값=0.32), 높은 담보 대출 비율(LTV>85%, 연체 위험 OR=2.1), 그리고 자영업자 상태(자영업자의 연체 확률은 급여소득자보다 1.8배 높음)를 확인하였습니다. 본 모델은 높은 정확도와 비즈니스 논리의 일관성을 결합하여 LTV>85% 및 PERFORMCNSSCORE<500을 고위험 고객 선별 기준으로 제안하며, 금융 기관에 동적인 위험 관리 도구를 제공합니다. 이 발견은 신용 위험 평가에서 첨단 기계 학습의 효과를 검증함과 동시에 대출 정책 개선 및 잠재 손실 감소를 위한 실질적 통찰을 제공합니다. 향후 연구에서는 거시경제 변수를 통합하여 동적 예측 능력을 강화할 수 있을 것입니다.
Building similarity graph...
Analyzing shared references across papers
Loading...
Xiaohui Wu
Tianjin University of Commerce
Theoretical and Natural Science
China University of Geosciences
Building similarity graph...
Analyzing shared references across papers
Loading...
샤오후이 우(수요일)는 이 문제를 연구했습니다.
synapsesocial.com/papers/68c1d5e554b1d3bfb60f8886 — DOI: https://doi.org/10.54254/2753-8818/2025.ad26291
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: