April 7, 2024Open Access

합성 데이터 훈련은 얼마나 나쁠까? 언어 모델 붕괴에 대한 통계적 분석

Key Points

Key points are not available for this paper at this time.

Abstract

모델 붕괴 현상은 (Shumailov et al., 2023)에서 소개된 것으로, 이전에 훈련된 모델에서 생성된 합성 데이터로 새로운 모델을 훈련할 때 발생하는 성능 저하를 의미합니다. 이 재귀적 훈련 루프는 원래 분포의 꼬리가 사라지게 하여, 향후 생성된 모델들이 초기(실제) 분포를 잊어버리게 만듭니다. 언어 모델에서 모델 붕괴를 철저히 이해하기 위해, 우리는 이 논문에서 다양한 재귀 훈련 시나리오의 영향을 특성화할 수 있는 통계적 모델을 고려합니다. 구체적으로, 우리는 오직 합성 데이터로만 훈련할 경우 모델 붕괴를 피할 수 없음을 입증합니다. 그러나 실제 데이터와 합성 데이터를 혼합할 때, 모델 붕괴를 최종적으로 피할 수 있는 최대 합성 데이터 양을 추정합니다. 우리의 이론적 결론은 경험적 검증에 의해 추가적으로 지지됩니다.

Read Full Paperexternally

AI에게 질문

Bookmark

View Full Paper