Key points are not available for this paper at this time.
우리는 레이블이 있는 문장에 대한 새로운 데이터 증강 방법인 맥락적 증강을 제안합니다. 우리는 문장이 패러다임 관계가 있는 다른 단어로 대체되더라도 자연스럽다는 불변성을 가정합니다. 우리는 단어 위치에서 양방향 언어 모델에 의해 예측된 다른 단어로 확률적으로 단어를 대체합니다. 맥락에 따라 예측된 단어는 많지만 원래 단어의 증강에 적합합니다. 게다가, 우리는 레이블 조건 구조로 언어 모델을 조정하여 모델이 레이블 호환성을 깨뜨리지 않고 문장을 증강할 수 있게 합니다. 여섯 가지 다양한 텍스트 분류 작업에 대한 실험을 통해 제안된 방법이 컨볼루션 또는 순환 신경망 기반의 분류기를 개선함을 보여줍니다.
코바야시 소스케 (수요일)은 이 질문을 연구했습니다.