Key points are not available for this paper at this time.
Objectif Les bras robotiques jouent un rôle crucial dans diverses opérations industrielles, telles que le tri, l'assemblage, la manipulation et le pulvérisation. Cependant, les algorithmes de contrôle traditionnels des bras robotiques ont souvent du mal à s'adapter lorsqu'ils sont confrontés à des obstacles dynamiques. Cet article vise à proposer une méthode d'évitement d'obstacles dynamique basée sur l'apprentissage par renforcement pour traiter le traitement en temps réel des obstacles dynamiques. Conception/méthodologie/approche Cet article introduit une méthode innovante qui présente un réseau d'extraction de caractéristiques intégrant des mécanismes de contrôle sur la base des algorithmes traditionnels d'apprentissage par renforcement. De plus, un mécanisme de récompense dynamique adaptatif est conçu pour optimiser la stratégie d'évitement d'obstacles. Résultats La validation à travers l'environnement de simulation CoppeliaSim et des tests sur site a démontré la capacité de la méthode à échapper efficacement à des obstacles se déplaçant aléatoirement, avec une amélioration significative de la vitesse de convergence par rapport aux algorithmes traditionnels. Originalité/valeur La méthode d'évitement d'obstacles dynamique proposée, fondée sur l'apprentissage par renforcement, accomplit non seulement la tâche d'évitement d'obstacles dynamiques de manière efficace, mais offre également un avantage distinct en termes de vitesse de convergence. Cette approche fournit une solution novatrice aux méthodes d'évitement d'obstacles pour les bras robotiques.
Wu et al. (Mon,) ont étudié cette question.