Contrôle de suivi optimisé utilisant l'apprentissage par renforcement et la technique de backstepping pour un système dynamique non linéaire canonique inconnu | Synapse