Aprendizado por reforço para planejamento de trajetória de manipulador robótico espacial flutuante livre com evasão de colisões e ruído de observação | Synapse