April 26, 2024Open Access

La prise de décision humaine équilibre la maximisation des récompenses et la compression des politiques

Key Points

Key points are not available for this paper at this time.

Abstract

La compression des politiques est un cadre computationnel qui décrit comment des agents à capacité limitée échangent des récompenses pour des politiques d'action plus simples afin de réduire le coût cognitif. Dans cette étude, nous présentons des preuves comportementales que les humains préfèrent des politiques plus simples, comme prédit par un modèle d'apprentissage par renforcement à capacité limitée. À travers un ensemble de tâches, nous trouvons que les individus exploitent la structure des relations entre états, actions et récompenses pour « compresser » leurs politiques. En particulier, les politiques compressées sont systématiquement biaisées vers des actions avec une probabilité marginale élevée, écartant ainsi certaines informations d'état. Ce biais est plus important lorsqu'il existe une redondance dans la politique d'action maximisant la récompense à travers les états, et augmente avec la charge mémoire. Ces résultats ne pouvaient pas être expliqués qualitativement ou quantitativement par des modèles qui n'utilisaient pas la compression de politique dans le cadre d'une limite de capacité. Nous avons également confirmé la prédiction selon laquelle la pression temporelle devrait réduire davantage la complexité des politiques et augmenter le biais d'action, basé sur l'hypothèse que les actions sont sélectionnées via le décodage dépendant du temps d'un code compressé. Ces découvertes contribuent à une compréhension plus profonde de la façon dont les humains adaptent leurs stratégies de prise de décision sous des contraintes de ressources cognitives.

La prise de décision humaine équilibre la maximisation des récompenses et la compression des politiques

Key Points

Abstract

Cite This Study

Also Consider

Also Consider