Key points are not available for this paper at this time.
Robôs biónicos possuem vantagens inerentes para operações subaquáticas, e a pesquisa em controle de movimento e tomada de decisão inteligente ampliou seu escopo de aplicação. Nos últimos anos, a aplicação de algoritmos de aprendizado por reforço no campo de robôs subaquáticos biónicos ganhou atenção considerável e continua a crescer. Neste artigo, apresentamos uma pesquisa abrangente sobre as conquistas dos algoritmos de aprendizado por reforço no campo dos robôs subaquáticos biónicos. Primeiramente, classificamos os métodos de aprendizado por reforço existentes e introduzimos tarefas de controle e tarefas de tomada de decisão com base na composição dos robôs subaquáticos biónicos. Discutimos ainda as vantagens e desafios do aprendizado por reforço para robôs biónicos em ambientes subaquáticos. Em segundo lugar, revisamos o estabelecimento dos algoritmos de aprendizado por reforço existentes para robôs subaquáticos biónicos a partir de diferentes perspectivas de tarefas. Em terceiro lugar, exploramos as soluções de treinamento e implantação existentes para algoritmos de aprendizado por reforço para robôs subaquáticos biónicos, com foco nos desafios impostos por ambientes subaquáticos complexos e robôs biónicos subatuados. Finalmente, discutimos as limitações e direções futuras de desenvolvimento do aprendizado por reforço no campo dos robôs subaquáticos biónicos. Esta pesquisa fornece uma base para explorar métodos de controle e tomada de decisão por aprendizado por reforço para robôs subaquáticos biónicos e oferece insights para futuras pesquisas.
Tong et al. (Qui,) estudaram esta questão.