Key points are not available for this paper at this time.
O Aprendizado por Reforço (RL) se tornou uma abordagem amplamente utilizada para jogos de perseguição-evasão. No entanto, o comportamento de tais modelos de RL é difícil de analisar, levando frequentemente a uma falta de confiança. Este artigo descreve um estudo em que utilizamos abordagens de aprendizado de máquina (ML) para desenvolver políticas de raciocínio metacognitivo que controlam as estratégias dos perseguidores. A abordagem proposta permite que agentes perseguidores capturem um evador mais rápido ao escolher estratégias de perseguição simples de forma colaborativa. Os resultados mostram que algumas políticas de raciocínio metacognitivo têm um desempenho melhor do que quaisquer combinações de estratégias de perseguição. Nossa abordagem fornece uma maneira inovadora para os agentes perseguidores raciocinarem sobre seus oponentes e adaptarem suas estratégias, o que pode ter implicações significativas para o design de agentes inteligentes em aplicações do mundo real.
Namala et al. (Sex,) estudaram essa questão.
Synapse has enriched 3 closely related papers on similar clinical questions. Consider them for comparative context: