La croissance rapide de la technologie a introduit des robots dans la vie quotidienne, nécessitant des cadres de navigation qui permettent un mouvement sûr et convivial tout en tenant compte des aspects sociaux. Ces méthodes doivent également s'adapter à des situations où plusieurs humains et robots se déplacent simultanément. Des avancées récentes en apprentissage par renforcement profond (DRL) ont permis d'incorporer ces normes dans la navigation. Ce travail présente un cadre de navigation socialement conscient pour les robots mobiles opérant dans des environnements partagés avec des humains et d'autres robots. L'approche, basée sur le DRL à agent unique, modélise tous les types d'interaction entre le robot égo, les humains et les autres robots. La formation utilise une fonction de récompense équilibrant l'achèvement des tâches, l'évitement des collisions et le maintien de distances confortables par rapport aux humains. Un mécanisme d'attention permet au cadre d'extraire des connaissances sur l'importance relative des agents environnants, guidant ainsi une navigation plus sûre et plus efficace. Notre approche est testée dans des environnements d'obstacles dynamiques et statiques. Pour améliorer l'efficacité de l'entraînement et promouvoir des comportements socialement appropriés, l'apprentissage par imitation est utilisé. Les évaluations comparatives avec des méthodes à la pointe de la technologie soulignent les avantages de notre approche, en particulier dans l'amélioration de la sécurité en réduisant les collisions et en préservant les distances de confort. Les résultats confirment l'efficacité de notre politique apprise et sa capacité à extraire des connaissances socialement pertinentes dans des environnements humain-robot où la conformité sociale est essentielle pour le déploiement.
Kabir et al. (Ven,) ont étudié cette question.