October 14, 2021Open Access

Estratégia de Perseguição em Duas Etapas para Missões de Perseguição-Evasão Espaciais Impulsivas com Informações Incompletas Usando Aprendizado por Reforço

Key Points

Key points are not available for this paper at this time.

Abstract

Este artigo apresenta uma estratégia de perseguição em duas etapas, nova e robusta, para missões de perseguição-evasão espaciais impulsivas com informações incompletas, considerando a perturbação J2. A estratégia inicialmente modela o problema do jogo de perseguição-evasão impulsivo em uma fase de encontro a longa distância e uma fase de jogo a curta distância, de acordo com o alcance de percepção do evasor. Para a fase de encontro a longa distância, ela é transformada em um problema de otimização de trajeto de encontro e uma nova função objetivo é proposta para obter a trajetória de perseguição com a capacidade de perseguição terminal ótima. Para a fase de jogo a curta distância, uma abordagem de perseguição de ciclo fechado é proposta utilizando um dos algoritmos de aprendizado por reforço, ou seja, o algoritmo de gradiente de política determinística profunda, para resolver e atualizar a trajetória de perseguição para as missões de perseguição-evasão impulsivas com informações incompletas. A viabilidade desta nova estratégia e sua robustez a diferentes estados iniciais do perseguidor e do evasor e às estratégias de evasão são demonstradas para os cenários de jogo de perseguição-evasão em órbita sol-síncrona. Os resultados dos testes de Monte Carlo mostram que a razão de sucesso da perseguição do método proposto é superior a 91% para todos os cenários dados.

Bookmark

View Full Paper

Bookmark

View Full Paper

Estratégia de Perseguição em Duas Etapas para Missões de Perseguição-Evasão Espaciais Impulsivas com Informações Incompletas Usando Aprendizado por Reforço

Key Points

Abstract

Cite This Study