Key points are not available for this paper at this time.
Métodos de controle baseados em aprendizagem orientada a dados, como o aprendizado por reforço (RL), tornaram-se cada vez mais populares com a recente proliferação do paradigma de aprendizado de máquina. Esses métodos abordam a sensibilidade a parâmetros e dinâmicas não modeladas em controladores baseados em modelos, como o controle preditivo de modelo com conjunto de controle finito. Agentes de RL são tipicamente utilizados em ambientes de simulação, onde são permitidos a explorar múltiplas ações “inseguras” durante o processo de aprendizagem. No entanto, esse tipo de aprendizagem não é aplicável à aprendizagem autônoma online de controladores em conversores de energia físicos, pois ações inseguras poderiam danificá-los. Para resolver isso, esta carta propõe uma estrutura de controle segura baseada em RL online para encontrar autonomamente a estratégia de comutação ideal para os conversores de energia, garantindo a segurança do sistema durante todo o processo de autoaprendizagem. O controle seguro baseado em RL online proposto é validado em um ambiente de teste prático em um sistema de conversor de fonte de tensão de dois níveis, e os resultados confirmam a eficácia do método proposto.
Wan et al. (Qua,) estudaram esta questão.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: