Key points are not available for this paper at this time.
Este artigo apresenta uma estratégia de perseguição em duas etapas, nova e robusta, para missões de perseguição-evasão espaciais impulsivas com informações incompletas, considerando a perturbação J2. A estratégia inicialmente modela o problema do jogo de perseguição-evasão impulsivo em uma fase de encontro a longa distância e uma fase de jogo a curta distância, de acordo com o alcance de percepção do evasor. Para a fase de encontro a longa distância, ela é transformada em um problema de otimização de trajeto de encontro e uma nova função objetivo é proposta para obter a trajetória de perseguição com a capacidade de perseguição terminal ótima. Para a fase de jogo a curta distância, uma abordagem de perseguição de ciclo fechado é proposta utilizando um dos algoritmos de aprendizado por reforço, ou seja, o algoritmo de gradiente de política determinística profunda, para resolver e atualizar a trajetória de perseguição para as missões de perseguição-evasão impulsivas com informações incompletas. A viabilidade desta nova estratégia e sua robustez a diferentes estados iniciais do perseguidor e do evasor e às estratégias de evasão são demonstradas para os cenários de jogo de perseguição-evasão em órbita sol-síncrona. Os resultados dos testes de Monte Carlo mostram que a razão de sucesso da perseguição do método proposto é superior a 91% para todos os cenários dados.
Yang et al. (Qui,) estudaram essa questão.