Proponemos un enfoque híbrido a la Teoría de la Mente (ToM) de la máquina que utiliza grandes modelos de lenguaje (LLMs) como un mecanismo para generar hipótesis y funciones de probabilidad con un modelo de planificación inversa bayesiana que calcula probabilidades posteriores para los estados mentales probables de un agente dados sus acciones. Los modelos de planificación inversa bayesiana pueden predecir con precisión el razonamiento humano en una variedad de tareas de ToM, pero estos modelos están limitados en su capacidad para escalar estas predicciones a escenarios con un gran número de hipótesis y acciones posibles. Por el contrario, los enfoques basados en LLM han demostrado recientemente ser prometedores en la resolución de puntos de referencia de ToM, pero pueden exhibir fragilidad y fallos en tareas de razonamiento incluso cuando aprueban versiones estructuralmente idénticas. Al combinar estos dos métodos, este enfoque aprovecha las fortalezas de cada componente, logrando resultados óptimos en una tarea inspirada en modelos de planificación inversa anteriores y mejorando el rendimiento en relación con modelos que utilizan LLM por sí solos o con sugerencias de cadena de pensamiento, incluso con LLM más pequeños que típicamente tienen un rendimiento deficiente en tareas de ToM. También mostramos el potencial del modelo para predecir estados mentales en tareas abiertas, ofreciendo una dirección prometedora para el desarrollo futuro de modelos de ToM y la creación de agentes generativos socialmente inteligentes.
Gelpí et al. (Vie,) estudiaron esta cuestión.