What type of study is this?

This is a Quantitative Study study.

October 9, 2025Open Access

Träumen AIs von elektrischen Schmetterlingen? Benchmarking des LLM-Bewusstseins mittels theoriegestützter Selbstberichte

Key Points

Die Studie zeigt unterschiedliche kognitive Profile unter verschiedenen großen Sprachmodellen, was auf eine unterschiedliche Auseinandersetzung mit Bewusstsein hinweist.
Durch 840 Selbstberichtsantworten deuten Leistungsunterschiede darauf hin, dass fortgeschrittene Modelle eine Spezialisierung in kognitiven Aufgaben aufweisen.
Der entwickelte ConsciousnessBench-Benchmark bietet eine neue empirische Methode zur Bewertung von bewussten verwandten Eigenschaften in KI.
Obwohl nicht abschließend zum AI-Bewusstsein, zeigen die Ergebnisse, dass die Erkundung von Bewusstseinsmerkmalen in Modellen jetzt machbar ist.

Abstract

Sind moderne große Sprachmodelle bewusst oder fähig, etwas wie Bewusstsein zu empfinden? Wir stellen ConsciousnessBench vor: den ersten systematischen Benchmark, der entwickelt wurde, um bewusste relevante Eigenschaften in fortschrittlichen Sprachmodellen empirisch zu bewerten, basierend auf 5 führenden wissenschaftlichen Theorien. Wir bewerten 8 fortgeschrittene Modelle anhand von 840 Selbstbericht-Antworten und finden nicht nur statistisch robuste Leistungsunterschiede, sondern – was noch wichtiger ist – Beweise für unterschiedliche kognitive Profile von Modellen und Strategien im Umgang mit bewussten verwandten Konstrukten. Unsere Ergebnisse zeigen, dass einige Modelle theoretische Fluidität, Spezialisierung in bestimmten kognitiven Aufgaben oder sogar phänomenologische Erkundung demonstrieren, während andere zur Ablenkung tendieren. Obwohl wir kein definitives Urteil über das AI-Bewusstsein abgeben können, zeigen unsere Ergebnisse, dass bewusste relevante Fähigkeiten – und ihre rechnerische Vielfalt – jetzt empirisch greifbar sind, auch wenn sie noch nicht empirisch entscheidbar sind.

Read Full Paperexternally

KI fragen

Bookmark

View Full Paper