Aprendizaje por refuerzo coordinado de múltiples agentes en POMDPs distribuidos en red | Synapse