November 25, 2004Open Access

통계적 기계 번역을 위한 정렬 템플릿 접근법

Key Points

Key points are not available for this paper at this time.

Abstract

구문 기반의 통계적 기계 번역 접근법인 정렬 템플릿 접근법이 설명된다. 이 번역 접근법은 단어 간의 일반적인 다대다 관계를 허용한다. 따라서 단어의 맥락이 번역 모델에 반영되며, 출발어에서 목표어로의 단어 순서의 지역적 변화가 명시적으로 학습될 수 있다. 이 모델은 일반적으로 사용되는 소스-채널 접근법의 일반화인 로그 선형 모델링 접근법을 사용하여 설명된다. 따라서 이 모델은 고전적인 통계적 기계 번역 시스템보다 확장하기가 더 쉽다. 우리는 구문 번역 학습을 위한 과정, 사용된 특징 함수, 검색 알고리즘을 자세히 설명한다. 이 접근법의 평가는 세 가지 다른 작업에서 수행된다. 독일어-영어 음성 Verbmobil 작업에 대해 다양한 시스템 구성 요소의 영향을 분석한다. 프랑스어-영어 캐나다 Hansards 작업에서는 정렬 템플릿 시스템이 단어 기반 번역 모델보다 유의미하게 더 나은 결과를 얻는다. 중국어-영어 2002년 국가기술표준원(NIST) 기계 번역 평가에서는 모든 경쟁 연구 및 상업용 번역 시스템보다 통계적으로 유의미하게 더 나은 NIST 점수를 얻는다.

AI에게 질문

Bookmark

View Full Paper