Key points are not available for this paper at this time.
En raison de la large gamme d'applications de l'apprentissage par renforcement multi-agents (MARL), comprendre les effets des attaques adversariales contre le modèle MARL est essentiel pour les applications sûres de ce modèle. Motivés par cela, nous enquêtons sur l'impact des attaques adversariales sur le MARL. Dans la configuration considérée, il y a un attaquant exogène capable de modifier les récompenses avant que les agents ne les reçoivent ou de manipuler les actions avant que l'environnement ne les reçoive. L'attaquant vise à guider chaque agent vers une politique cible ou à maximiser les récompenses cumulées selon une fonction de récompense spécifique choisie par l'attaquant, tout en minimisant la quantité de manipulation sur les retours d'information et l'action. Nous montrons d'abord les limites des attaques par intoxication d'action uniquement et des attaques par intoxication de récompense uniquement. Nous introduisons ensuite une stratégie d'attaque mixte combinant l'intoxication d'action et l'intoxication de récompense. Nous montrons que la stratégie d'attaque mixte peut attaquer efficacement les agents MARL même si l'attaquant n'a aucune information préalable sur l'environnement sous-jacent et les algorithmes des agents.
Liu et al. (Sat,) ont étudié cette question.