Die Sprache in einer Zweitsprache (L2) weicht in mehreren akustisch-phonettischen Dimensionen von der L1-Sprache ab. Frei Klassifikationsaufgaben haben gezeigt, dass L1-Hörer Ähnlichkeiten (oder Unterschiede) zwischen L2-Sprache auf der Grundlage von Faktoren wie Geschlecht des Sprechers, Grad des Fremdakzents oder wahrgenommener L1-Herkunft beurteilen. Die akustisch-phonettischen Dimensionen, die diesen Urteilen zugrunde liegen, sind jedoch wenig verstanden. Wir haben die wahrnehmungsbasierte Organisation der L2-Sprache mithilfe eines selbstüberwachten maschinellen Lernmodells untersucht, das auf einem großen Satz von L1-Sprache trainiert wurde. Satzaufnahmen von 63 L2-Englischsprechern aus 5 L1-Hintergründen (11–14 Sprecher/L1, 118–120 Sätze/Sprecher) wurden von diesem vortrainierten Modell in mehrdimensionale Darstellungen umgewandelt. Die durchschnittliche Ähnlichkeit zwischen den Sprechern innerhalb dieses mehrdimensionalen Raums war signifikant mit der L2-Verständlichkeit und der L1-Herkunft verbunden. Insbesondere erhielt ein Paar von L2-Englischsprechern mit höherer L2-Verständlichkeit oder gemeinsamer L1-Herkunft im Raum eine phonetisch ähnlicherer Darstellung als Paare von L2-Sprechern mit geringerer Verständlichkeit oder unterschiedlichen L1-Hintergründen. Unsere Untersuchung schlägt somit einen neuartigen Ansatz zur Erforschung der kognitiven Repräsentationen von Sprache vor. Die Anwendung von Techniken des maschinellen Lernens auf die Darstellung und Klassifikation von Sprachproben in einem vortrainierten, selbstüberwachten, hochdimensionalen Darstellungsraum eröffnet die Möglichkeit von Durchbrüchen in unserem Verständnis der Vielzahl von akustisch-phonettischen Dimensionen, die der Sprachvariation zugrunde liegen.
Kim et al. (Tue,) haben diese Frage untersucht.