Key points are not available for this paper at this time.
우리는 데이터 강화 예측 모델링(DEM)의 아이디어를 설명하고 분석합니다. 여기서 '강화'라는 용어는 모델링에 사용되는 데이터가 실제 대상 모집단에서 샘플링된 것이 아니라, 훨씬 더 큰 샘플을 사용할 수 있는 대체(밀접하게 관련된) 모집단에서 샘플링되었다는 경우를 의미합니다. 이는 '편향-분산' 트레이드오프를 초래하며, 일부 경우에는 DEM이 실제 대상 모집단의 예측 성능을 향상시킬 수 있음을 암시합니다. 우리는 선형 회귀의 경우에 대해 이 트레이드오프를 이론적으로 분석합니다. 우리는 소프트웨어 제품 세트를 위한 판매 목표 설정 문제에서 DEM을 설명합니다. '올바른' 학습 문제는 비고객과 새로 확보한 고객을 구분하는 것입니다. 그러나 후자는 희소합니다. 우리는 더 큰 학습 샘플을 제공하는 흥미로운 목표에 대한 보다 유연한 정의를 사용하여 더 나은 예측 모델을 구축할 수 있는 방법을 설명합니다.
Rosset et al. (Thu,)는 이 질문을 연구했습니다.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: