Apprentissage par renforcement hors ligne basé sur un modèle avec augmentation de données adversariales | Synapse