Key points are not available for this paper at this time.
모델 붕괴 현상은 (Shumailov et al., 2023)에서 소개된 것으로, 이전에 훈련된 모델에서 생성된 합성 데이터로 새로운 모델을 훈련할 때 발생하는 성능 저하를 의미합니다. 이 재귀적 훈련 루프는 원래 분포의 꼬리가 사라지게 하여, 향후 생성된 모델들이 초기(실제) 분포를 잊어버리게 만듭니다. 언어 모델에서 모델 붕괴를 철저히 이해하기 위해, 우리는 이 논문에서 다양한 재귀 훈련 시나리오의 영향을 특성화할 수 있는 통계적 모델을 고려합니다. 구체적으로, 우리는 오직 합성 데이터로만 훈련할 경우 모델 붕괴를 피할 수 없음을 입증합니다. 그러나 실제 데이터와 합성 데이터를 혼합할 때, 모델 붕괴를 최종적으로 피할 수 있는 최대 합성 데이터 양을 추정합니다. 우리의 이론적 결론은 경험적 검증에 의해 추가적으로 지지됩니다.
Seddik et al. (Sun,)은 이 질문을 연구했습니다.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: