Metapher ist ein allgegenwärtiges Merkmal der Sprache und eine kraftvolle Linse zur Untersuchung von Kognition, Emotion und Ideologie. Die groß angelegte Analyse wurde jedoch durch die Notwendigkeit manueller Annotationen eingeschränkt, da Metaphern kontextabhängig sind. Diese Studie untersucht das Potenzial großer Sprachmodelle (LLMs), die Metaphernidentifikation in vollständigen Texten zu automatisieren. Wir vergleichen drei Methoden: (i) Retrieval-augmented Generation (RAG), bei der dem Modell ein Kodex zur Verfügung gestellt wird und es angewiesen wird, Texte basierend auf dessen Regeln und Beispielen zu annotieren; (ii) Prompt-Engineering, bei dem wir aufgabenspezifische verbale Anweisungen entwerfen; und (iii) Feinabstimmung, bei der das Modell auf handkodierten Texten trainiert wird, um die Leistung zu optimieren. Innerhalb des Prompt-Engineering testen wir Zero-Shot-, Few-Shot- und Chain-of-Thought-Strategien. Unsere Ergebnisse zeigen, dass modernste Closed-Source-LLMs hohe Genauigkeit erzielen können, wobei die Feinabstimmung eine mediane F1-Score von 0,79 erreicht. Ein Vergleich menschlicher und LLM-Ausgaben zeigt, dass die meisten Unterschiede systematisch sind und bekannte Graubereiche sowie konzeptionelle Herausforderungen der Metapherntheorie widerspiegeln. Wir schlagen vor, dass LLMs zur teilweisen Automatisierung der Metaphernidentifikation verwendet werden können und als Testumgebung zur Entwicklung und Verfeinerung von Metaphernidentifikationsprotokollen sowie der zugrundeliegenden Theorie dienen können.
Fuoli et al. (Mon,) haben diese Fragestellung untersucht.