What type of study is this?

This is a Quantitative Study study.

October 5, 2025Open Access

Metaphernidentifikation mittels großer Sprachmodelle: Ein Vergleich von RAG, Prompt-Engineering und Feinabstimmung

Key Points

Die Feinabstimmung erzielte eine mediane F1-Score von 0,79 bei der Metaphernidentifikation mit großen Sprachmodellen.
Die Ergebnisse zeigen eine hohe Genauigkeit mit Closed-Source-LLMs und unterstreichen die Bedeutung von Modelltrainingstechniken.
Vergleiche zwischen menschlichen und LLM-Ausgaben zeigen systematische Abweichungen und heben Herausforderungen der Metapherntheorie hervor.
Retrieval-augmented Generation und Prompt-Engineering-Methoden beeinflussen die Leistung von LLMs bei der Identifikation von Metaphern maßgeblich.

Abstract

Metapher ist ein allgegenwärtiges Merkmal der Sprache und eine kraftvolle Linse zur Untersuchung von Kognition, Emotion und Ideologie. Die groß angelegte Analyse wurde jedoch durch die Notwendigkeit manueller Annotationen eingeschränkt, da Metaphern kontextabhängig sind. Diese Studie untersucht das Potenzial großer Sprachmodelle (LLMs), die Metaphernidentifikation in vollständigen Texten zu automatisieren. Wir vergleichen drei Methoden: (i) Retrieval-augmented Generation (RAG), bei der dem Modell ein Kodex zur Verfügung gestellt wird und es angewiesen wird, Texte basierend auf dessen Regeln und Beispielen zu annotieren; (ii) Prompt-Engineering, bei dem wir aufgabenspezifische verbale Anweisungen entwerfen; und (iii) Feinabstimmung, bei der das Modell auf handkodierten Texten trainiert wird, um die Leistung zu optimieren. Innerhalb des Prompt-Engineering testen wir Zero-Shot-, Few-Shot- und Chain-of-Thought-Strategien. Unsere Ergebnisse zeigen, dass modernste Closed-Source-LLMs hohe Genauigkeit erzielen können, wobei die Feinabstimmung eine mediane F1-Score von 0,79 erreicht. Ein Vergleich menschlicher und LLM-Ausgaben zeigt, dass die meisten Unterschiede systematisch sind und bekannte Graubereiche sowie konzeptionelle Herausforderungen der Metapherntheorie widerspiegeln. Wir schlagen vor, dass LLMs zur teilweisen Automatisierung der Metaphernidentifikation verwendet werden können und als Testumgebung zur Entwicklung und Verfeinerung von Metaphernidentifikationsprotokollen sowie der zugrundeliegenden Theorie dienen können.

Metaphernidentifikation mittels großer Sprachmodelle: Ein Vergleich von RAG, Prompt-Engineering und Feinabstimmung

Key Points

Abstract

Cite This Study