Key points are not available for this paper at this time.
Das Problem der Modifikationsbearbeitung betrifft die Frage, wie Sprachmodelle im Laufe der Zeit neue Fakten über die Welt lernen sollten. Während empirische Forschung zur Modifikationsbearbeitung breite Aufmerksamkeit erlangt hat, sind die konzeptionellen Grundlagen der Modifikationsbearbeitung weiterhin wackelig – was nicht überraschend ist, da die Modifikationsbearbeitung im Wesentlichen Überzeugungsrevision ist, ein seit langem bekanntes Problem in der Philosophie, das seit Jahrzehnten keine prägnante Lösung gefunden hat. Dennoch erfordert die Modifikationsbearbeitung eine Lösung, da wir in der Lage sein müssen, das Wissen innerhalb von Sprachmodellen zu kontrollieren. Mit diesem Ziel vor Augen kritisiert dieses Papier die Standardformulierung des Problems der Modifikationsbearbeitung und schlägt ein formales Testfeld für die Forschung zur Modifikationsbearbeitung vor. Zunächst beschreiben wir 12 offene Probleme der Modifikationsbearbeitung, basierend auf Herausforderungen bei (1) der Definition des Problems, (2) der Entwicklung von Benchmarks und (3) der grundsätzlichen Annahme, dass LLMs editierbare Überzeugungen besitzen. Viele dieser Herausforderungen sind äußerst schwierig zu bewältigen, z. B. die Bestimmung weitreichender Konsequenzen von Änderungen, die Kennzeichnung probabilistischer Folgerungen zwischen Fakten und die Aktualisierung von Überzeugungen von Agenten-Simulatoren. Anschließend stellen wir einen semi-synthetischen Datensatz für die Modifikationsbearbeitung vor, der auf Wikidata basiert, wo wir Änderungen anhand von Labels eines idealisierten bayesschen Agenten bewerten können. Dies ermöglicht es uns genau zu sagen, inwiefern die Überzeugungsrevision in Sprachmodellen hinter einem wünschenswerten epistemischen Standard zurückbleibt. Wir ermutigen zu weiterer Forschung, die Kontexte untersucht, in denen ein solcher Goldstandard verglichen werden kann. Unser Code ist öffentlich zugänglich unter: https://github.com/peterbhase/LLM-belief-revision
Hase et al. (Do,) haben diese Frage untersucht.