Key points are not available for this paper at this time.
La compression des politiques est un cadre computationnel qui décrit comment des agents à capacité limitée échangent des récompenses pour des politiques d'action plus simples afin de réduire le coût cognitif. Dans cette étude, nous présentons des preuves comportementales que les humains préfèrent des politiques plus simples, comme prédit par un modèle d'apprentissage par renforcement à capacité limitée. À travers un ensemble de tâches, nous trouvons que les individus exploitent la structure des relations entre états, actions et récompenses pour « compresser » leurs politiques. En particulier, les politiques compressées sont systématiquement biaisées vers des actions avec une probabilité marginale élevée, écartant ainsi certaines informations d'état. Ce biais est plus important lorsqu'il existe une redondance dans la politique d'action maximisant la récompense à travers les états, et augmente avec la charge mémoire. Ces résultats ne pouvaient pas être expliqués qualitativement ou quantitativement par des modèles qui n'utilisaient pas la compression de politique dans le cadre d'une limite de capacité. Nous avons également confirmé la prédiction selon laquelle la pression temporelle devrait réduire davantage la complexité des politiques et augmenter le biais d'action, basé sur l'hypothèse que les actions sont sélectionnées via le décodage dépendant du temps d'un code compressé. Ces découvertes contribuent à une compréhension plus profonde de la façon dont les humains adaptent leurs stratégies de prise de décision sous des contraintes de ressources cognitives.
Lai et al. (Fri,) ont étudié cette question.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: