Key points are not available for this paper at this time.
Resolver problemas de controle ótimo não lineares é uma tarefa desafiadora, particularmente para problemas de alta dimensão. Propomos algoritmos para iterações de política baseadas em modelos para resolver problemas de controle ótimo não lineares com garantias de convergência. O principal componente de nossa abordagem é um procedimento iterativo que utiliza aproximações neurais para resolver equações diferenciais parciais lineares (EDPs), garantindo a convergência. Apresentamos duas variantes dos algoritmos. A primeira variante formula o problema de otimização como um problema de mínimos quadrados lineares, inspirando-se em máquinas de aprendizado extremo (ELM) para resolver EDPs. Esta variante lida de forma eficiente com problemas de baixa dimensão com alta precisão. A segunda variante é baseada em uma rede neural informada pela física (PINN) para resolver EDPs e tem o potencial de abordar problemas de alta dimensão. Demonstramos que ambos os algoritmos superam abordagens tradicionais, como os métodos de Galerkin, por uma margem significativa. Fornecemos uma análise teórica de ambos os algoritmos em termos de convergência das aproximações neurais em direção às verdadeiras soluções ótimas em um cenário geral. Além disso, empregamos técnicas de verificação formal para demonstrar a estabilidade verificável dos controladores resultantes.
Meng et al. (Qui,) estudaram esta questão.