XRL en pratique : comment l'apprentissage par renforcement est devenu un système, et non un modèle | Synapse