Key points are not available for this paper at this time.
Recentemente, várias abordagens foram propostas para aprender políticas multiagente descentralizadas profundas que coordenam por meio de um canal de comunicação diferenciável. Embora essas políticas sejam eficazes para muitas tarefas, a interpretação de suas estratégias de comunicação induzidas tem permanecido um desafio. Aqui, propomos interpretar as mensagens dos agentes traduzindo-as. Ao contrário dos problemas típicos de tradução automática, não temos dados paralelos para aprender. Em vez disso, desenvolvemos um modelo de tradução com base na percepção de que mensagens de agentes e strings de linguagem natural significam a mesma coisa se induzem a mesma crença sobre o mundo em um ouvinte. Apresentamos garantias teóricas e evidências empíricas de que nossa abordagem preserva tanto a semântica quanto a pragmática das mensagens, garantindo que os jogadores que se comunicam por meio de uma camada de tradução não sofram uma perda substancial de recompensa em relação a jogadores com uma linguagem comum.
Andreas et al. (Sun,) estudaram essa questão.