March 3, 2026Open Access

A tradução automática pode realmente ajudar as línguas minoritárias na Europa?

Key Points

Os sistemas de tradução automática podem falhar em apoiar efetivamente as línguas minoritárias devido à escassez de dados.
A tradução automática neural e os modelos de linguagem grandes demonstram potencial, mas são frequentemente centrados no inglês.
Avaliar as realidades sociolinguísticas é crucial para melhorar a qualidade da tradução em contextos de línguas minoritárias.
Diretrizes são propostas para abordar potenciais danos na implementação de sistemas de tradução automática.

Abstract

A tradução automática (TA) melhorou consideravelmente sua qualidade na última década e tornou-se quase onipresente em todos os aspectos da sociedade. A TA neural (TAN) e, mais recentemente, modelos de linguagem grandes (MLGs) como o transformer generativo pré-treinado (GPT) tornaram as traduções para muitas línguas facilmente acessíveis a todos os usuários de qualquer telefone ou computador. No entanto, a maioria dos modelos de TA é centrada no inglês e produz bons resultados apenas para aquelas línguas com grandes quantidades de dados. Para as línguas minoritárias, o desafio é muitas vezes entendido como a escassez de dados, embora diferenças sistêmicas entre as comunidades linguísticas deveriam ser consideradas se os sistemas de TA para essas línguas realmente quiserem ser úteis. Neste artigo, usamos cenários de valor para imaginar os impactos sistêmicos para duas línguas com realidades sociolinguísticas diferenciadas: catalão e careliano. O objetivo é delinear os principais desafios e potenciais danos ao considerar a TA para línguas minoritárias e sugerir algumas diretrizes gerais que devem ser seguidas em pesquisas e aplicações futuras.

A tradução automática pode realmente ajudar as línguas minoritárias na Europa?

Key Points

Abstract

Cite This Study