Key points are not available for this paper at this time.
Die Überbrückung der signifikanten Kluft zwischen der englischen und der nicht-englischen Leistung großer Sprachmodelle stellt eine große Herausforderung dar. Während einige frühere Studien versuchen, diese Kluft mit übersetzten Trainingsdaten zu mindern, nutzt der kürzlich vorgeschlagene Ansatz zur Fragenanpassung die Expertise des Modells in Englisch, um die mehrsprachige Leistung mit minimalem Einsatz teurer, fehleranfälliger Übersetzungen zu verbessern. In diesem Papier untersuchen wir, wie breit dieser Ansatz angewendet werden kann, indem wir seine Auswirkungen auf das Denken mit ausführbarem Code und das Denken mit gesundem Menschenverstand analysieren. Wir untersuchen auch, wie dieser Ansatz effizient auf extrem große Sprachmodelle unter Verwendung von Proxy-Tuning angewendet werden kann. Experimentelle Ergebnisse zu mehrsprachigen Denkbänken mGSM, mSVAMP und xCSQA zeigen, dass der Ansatz zur Fragenanpassung verwendet werden kann, um die mehrsprachige Leistung über verschiedene Denkszenarien, Modellfamilien und -größen hinweg zu steigern. Beispielsweise bringt unsere Methode bei den LLaMA2-Modellen eine durchschnittliche Genauigkeitsverbesserung von 12,2 % bei mGSM, selbst mit dem 70B-Modell. Um den Mechanismus seines Erfolgs zu verstehen, analysieren wir den Darstellungsraum, den Denkprozess und die Skalen der Übersetzungsdaten, was zeigt, wie das Training zur Fragenübersetzung die Sprachenausrichtung innerhalb von LLMs stärkt und deren Arbeitsmuster prägt.
Zhu et al. (Thu,) untersuchten diese Frage.