A tradução automática (TA) melhorou consideravelmente sua qualidade na última década e tornou-se quase onipresente em todos os aspectos da sociedade. A TA neural (TAN) e, mais recentemente, modelos de linguagem grandes (MLGs) como o transformer generativo pré-treinado (GPT) tornaram as traduções para muitas línguas facilmente acessíveis a todos os usuários de qualquer telefone ou computador. No entanto, a maioria dos modelos de TA é centrada no inglês e produz bons resultados apenas para aquelas línguas com grandes quantidades de dados. Para as línguas minoritárias, o desafio é muitas vezes entendido como a escassez de dados, embora diferenças sistêmicas entre as comunidades linguísticas deveriam ser consideradas se os sistemas de TA para essas línguas realmente quiserem ser úteis. Neste artigo, usamos cenários de valor para imaginar os impactos sistêmicos para duas línguas com realidades sociolinguísticas diferenciadas: catalão e careliano. O objetivo é delinear os principais desafios e potenciais danos ao considerar a TA para línguas minoritárias e sugerir algumas diretrizes gerais que devem ser seguidas em pesquisas e aplicações futuras.
Alvarez-Vidal et al. (Mon,) estudaram essa questão.