What type of study is this?

This is a Quantitative Study study.

October 12, 2025Open Access

Pt-HotpotQA : Évaluation de la réponse à des questions multi-saut sur des ensembles de données originaux et traduits en portugais à l'aide de LLMs

Key Points

Les modèles multilingues affichent des performances significativement meilleures en anglais qu'en portugais, soulignant des défis spécifiques à chaque langue.
Le fine-tuning des modèles de langage de grande taille améliore les résultats de la réponse à des questions multi-saut dans les ensembles de données en portugais.
L'évaluation utilise la référence HotpotQA, offrant une vue d'ensemble sur les LLMs et la réponse à des questions multilingues.
Les résultats suggèrent un rétrécissement de l'écart de performance en portugais avec une augmentation de la taille du modèle, soulignant la nécessité de modèles plus grands dans ce contexte.

Abstract

La réponse à des questions multi-saut (MHQA) fait progresser le traitement du langage naturel en incitant les modèles à combiner des informations provenant de plusieurs sources dans une série d'étapes de raisonnement. Malgré des avancées substantielles dans la MHQA pour l'anglais, les ressources pour évaluer les modèles de langage de grande taille (LLMs) en portugais restent rares. Pour combler cette lacune, nous introduisons une traduction portugaise du dataset HotpotQA, une référence bien établie pour la MHQA en anglais. Nous évaluons systématiquement plusieurs variantes du LLM multilingue Llama sur les ensembles de données originaux et traduits, en analysant les variations de performance par langue. Nos résultats montrent que les modèles multilingues fonctionnent systématiquement mieux en anglais qu'en portugais, bien que cet écart se réduise avec l'augmentation de la taille du modèle. De plus, nous montrons l'impact du fine-tuning sur l'amélioration des performances de MHQA en portugais. Cette étude fournit des informations précieuses pour optimiser les LLMs dans des contextes multilingues et contribue à une référence pertinente pour la recherche en MHQA en portugais.

Read Full Paperexternally

Demander à l'IA

Bookmark

View Full Paper