Key points are not available for this paper at this time.
우리는 라벨링된 훈련 데이터의 양이 다른 언어를 파싱하기 위한 잠재 주석이 포함된 자기 훈련 PCFG 문법(PCFG-LA)의 효과를 조사합니다. Charniak의 어휘화된 파서를 기준으로, PCFG-LA 파서는 파싱이 덜 발전된 언어(예: 중국어)에 더 효과적으로 적응하였고 자기 훈련에서 더 많은 혜택을 보았습니다. 우리는 자기 훈련이 소량 및 대량의 라벨링된 훈련 데이터에 대해 단일 생성 파서인 PCFG-LA 파서의 성능을 유의미하게 향상시킬 수 있음을 처음으로 보여줍니다. 우리의 접근법은 단일 파서에 대해 영어(91.5%)와 중국어(85.2%) 모두에서 최첨단 파싱 정확도를 달성합니다.
Huang 외 (목요일,)는 이 질문을 연구했습니다.