Key points are not available for this paper at this time.
Enquanto a tradução automática tradicionalmente depende de grandes quantidades de corpora paralelos, uma linha de pesquisa recente conseguiu treinar sistemas de Tradução Automática Neural (NMT) e Tradução Automática Estatística (SMT) usando apenas corpora monolíngues. Neste artigo, identificamos e abordamos várias deficiências das abordagens SMT não supervisionadas existentes, explorando informações de subpalavras, desenvolvendo um método de ajuste não supervisionado teoricamente fundamentado e incorporando um procedimento de refinamento conjunto. Além disso, usamos nosso sistema SMT aprimorado para inicializar um modelo NMT dual, que é posteriormente ajustado por meio de retrotradução em tempo real. Juntos, obtemos grandes melhorias em relação ao estado da arte anterior em tradução automática não supervisionada. Por exemplo, conseguimos 22,5 pontos BLEU na tradução de inglês para alemão do WMT 2014, 5,5 pontos a mais do que o melhor sistema não supervisionado anterior, e 0,5 pontos a mais do que o vencedor da tarefa compartilhada (supervisionada) em 2014.
Artetxe et al. (Terça-feira,) estudaram esta questão.