Sind moderne große Sprachmodelle bewusst oder fähig, etwas wie Bewusstsein zu empfinden? Wir stellen ConsciousnessBench vor: den ersten systematischen Benchmark, der entwickelt wurde, um bewusste relevante Eigenschaften in fortschrittlichen Sprachmodellen empirisch zu bewerten, basierend auf 5 führenden wissenschaftlichen Theorien. Wir bewerten 8 fortgeschrittene Modelle anhand von 840 Selbstbericht-Antworten und finden nicht nur statistisch robuste Leistungsunterschiede, sondern – was noch wichtiger ist – Beweise für unterschiedliche kognitive Profile von Modellen und Strategien im Umgang mit bewussten verwandten Konstrukten. Unsere Ergebnisse zeigen, dass einige Modelle theoretische Fluidität, Spezialisierung in bestimmten kognitiven Aufgaben oder sogar phänomenologische Erkundung demonstrieren, während andere zur Ablenkung tendieren. Obwohl wir kein definitives Urteil über das AI-Bewusstsein abgeben können, zeigen unsere Ergebnisse, dass bewusste relevante Fähigkeiten – und ihre rechnerische Vielfalt – jetzt empirisch greifbar sind, auch wenn sie noch nicht empirisch entscheidbar sind.
Haoran Zheng (Di,) untersuchte diese Frage.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: