Dieser Preprint untersucht die Vorhersehbarkeit des trial-by-trial menschlichen Regel-Lernverhaltens unter Verwendung des Badham et al. (2017) Datensatzes. Wir vergleichen kognitive und datengestützte Modelle, einschließlich Win-Stay-Lose-Shift, Q-Learning, LSTM und XGBoost, unter Verwendung einer Leave-One-Participant-Out-Kreuzvalidierung. Die Ergebnisse zeigen, dass episodisches Zurücksetzen von Verhaltenshistorien-Funktionen den größten Leistungszuwachs bietet und dass die Modellleistung ein praktisches Vorhersageplateau nahe AUC = 0.676 erreicht. Verhaltensclusterung zerlegt die Vorhersehbarkeit auf Populationsebene weiter in vier Lernertypen.
Hamid et al. (Wed,) untersuchten diese Frage.