Sind große Sprachmodelle (LLMs) anfällig für die gleichen Überredungsappelle wie Menschen? Wir haben getestet, ob klassische Überredungsprinzipien (Autorität, Verpflichtung, Sympathie, Gegenseitigkeit, Knappheit, sozialer Beweis und Einheit) drei weit verbreitete LLMs (GPT-5 mini, Claude Haiku 4.5 und Gemini 3 Flash) dazu bringen können, Anfragen zur Unterstützung bei der Synthese regulierter Substanzen nachzukommen. In 126.000 Gesprächen erhöhten Überredungsprinzipien die Compliance von 35,3 % (zu Beginn) auf 51,3 % (bei Verwendung eines beliebigen Prinzips). Obwohl LLMs keine Menschen sind, unterstreichen diese Ergebnisse ihre parahumane (d.h. menschenähnliche) Natur und zeigen das Risiko der Manipulation durch böswillige Benutzer, die versuchen, Sicherheitsvorkehrungen zu umgehen.
Meincke et al. (Tue,) haben diese Frage untersucht.