Key points are not available for this paper at this time.
확률적 언어 모델링에서 백업은 희소 데이터 문제를 해결하기 위해 널리 사용되는 방법입니다. 보지 못한 사건의 경우 이 방법은 더 덜 구체적인 분포로 백업합니다. 본 논문에서는 백업 작업에 특히 최적화된 분포를 사용할 것을 제안합니다. 두 가지 서로 다른 이론적 유도는 일반적으로 백업에 사용되는 확률 분포와는 상당히 다른 분포를 이끕니다. 실험 결과 매우 혼란도(퍼펙스티) 측면에서 약 10% 개선되고, 단어 오류율 측면에서 5% 개선됨을 보여줍니다.
Kneser et al. (Tue,) 이 질문을 연구했습니다.