What type of study is this?

This is a Experimental Study study.

September 28, 2025Open Access

Apprendre à naviguer dans des foules mixtes humaines-robots via un cadre d'apprentissage par renforcement profond axé sur l'attention

Key Points

L'approche améliore la sécurité en réduisant les collisions dans des environnements bondés avec des humains et des robots.
Une fonction de récompense équilibre l'achèvement des tâches et le maintien de distances confortables par rapport aux humains lors de la navigation.
L'apprentissage par imitation améliore l'efficacité de la formation et promeut des comportements socialement appropriés lors des interactions.
Les évaluations comparatives confirment l'efficacité du cadre de navigation, en particulier dans des scénarios dynamiques.

Abstract

La croissance rapide de la technologie a introduit des robots dans la vie quotidienne, nécessitant des cadres de navigation qui permettent un mouvement sûr et convivial tout en tenant compte des aspects sociaux. Ces méthodes doivent également s'adapter à des situations où plusieurs humains et robots se déplacent simultanément. Des avancées récentes en apprentissage par renforcement profond (DRL) ont permis d'incorporer ces normes dans la navigation. Ce travail présente un cadre de navigation socialement conscient pour les robots mobiles opérant dans des environnements partagés avec des humains et d'autres robots. L'approche, basée sur le DRL à agent unique, modélise tous les types d'interaction entre le robot égo, les humains et les autres robots. La formation utilise une fonction de récompense équilibrant l'achèvement des tâches, l'évitement des collisions et le maintien de distances confortables par rapport aux humains. Un mécanisme d'attention permet au cadre d'extraire des connaissances sur l'importance relative des agents environnants, guidant ainsi une navigation plus sûre et plus efficace. Notre approche est testée dans des environnements d'obstacles dynamiques et statiques. Pour améliorer l'efficacité de l'entraînement et promouvoir des comportements socialement appropriés, l'apprentissage par imitation est utilisé. Les évaluations comparatives avec des méthodes à la pointe de la technologie soulignent les avantages de notre approche, en particulier dans l'amélioration de la sécurité en réduisant les collisions et en préservant les distances de confort. Les résultats confirment l'efficacité de notre politique apprise et sa capacité à extraire des connaissances socialement pertinentes dans des environnements humain-robot où la conformité sociale est essentielle pour le déploiement.

Apprendre à naviguer dans des foules mixtes humaines-robots via un cadre d'apprentissage par renforcement profond axé sur l'attention

Key Points

Abstract

Cite This Study