Key points are not available for this paper at this time.
Cette étude présente une approche innovante du contrôle optimal de la démarche pour un robot quadrupède souple équipé de quatre actionneurs souples compressibles entraînés par tendon (CTSA). Améliorant nos études précédentes sur l'utilisation de l'apprentissage par renforcement sans modèle pour le contrôle de la démarche, nous employons l'apprentissage par renforcement basé sur un modèle (MBRL) pour améliorer encore les performances du contrôleur de démarche. Comparé aux robots rigides, le robot quadrupède souple proposé a une meilleure sécurité, un poids réduit et un mécanisme plus simple pour la fabrication et le contrôle. Cependant, le principal défi réside dans le développement d'algorithmes de contrôle sophistiqués pour atteindre un contrôle optimal de la démarche pour une locomotion rapide et stable. La recherche utilise une méthodologie en plusieurs étapes, y compris la restriction de l'espace d'état, l'entraînement de modèles basés sur les données et le développement d'algorithmes d'apprentissage par renforcement. Par rapport aux méthodes de référence, l'algorithme MBRL proposé, combiné à un post-entraînement, améliore considérablement l'efficacité et les performances des politiques de contrôle de la démarche. La politique développée est à la fois robuste et adaptable à la morphologie déformable du robot. L'étude se conclut en soulignant l'applicabilité pratique de ces résultats dans des scénarios du monde réel.
Niu et al. (Mar,) ont étudié cette question.