Key points are not available for this paper at this time.
구문 기반의 통계적 기계 번역 접근법인 정렬 템플릿 접근법이 설명된다. 이 번역 접근법은 단어 간의 일반적인 다대다 관계를 허용한다. 따라서 단어의 맥락이 번역 모델에 반영되며, 출발어에서 목표어로의 단어 순서의 지역적 변화가 명시적으로 학습될 수 있다. 이 모델은 일반적으로 사용되는 소스-채널 접근법의 일반화인 로그 선형 모델링 접근법을 사용하여 설명된다. 따라서 이 모델은 고전적인 통계적 기계 번역 시스템보다 확장하기가 더 쉽다. 우리는 구문 번역 학습을 위한 과정, 사용된 특징 함수, 검색 알고리즘을 자세히 설명한다. 이 접근법의 평가는 세 가지 다른 작업에서 수행된다. 독일어-영어 음성 Verbmobil 작업에 대해 다양한 시스템 구성 요소의 영향을 분석한다. 프랑스어-영어 캐나다 Hansards 작업에서는 정렬 템플릿 시스템이 단어 기반 번역 모델보다 유의미하게 더 나은 결과를 얻는다. 중국어-영어 2002년 국가기술표준원(NIST) 기계 번역 평가에서는 모든 경쟁 연구 및 상업용 번역 시스템보다 통계적으로 유의미하게 더 나은 NIST 점수를 얻는다.
Och 외 (Thu,)은 이 질문을 연구했습니다.