October 16, 2020

Revisão da pesquisa em aprendizado por reforço

Key Points

Key points are not available for this paper at this time.

Abstract

O aprendizado por reforço é um tipo de aprendizado de máquina. Uma característica importante que o distingue de outros tipos de aprendizado é que o aprendizado por reforço usa informações de treinamento para avaliar as ações tomadas. A ação correta orienta a escolha da ação. O agente não é informado sobre qual ação deve ser realizada e qual ação não deve ser feita. Em vez disso, ele tenta descobrir qual ação pode produzir a máxima recompensa. Portanto, o aprendizado por reforço é um mecanismo de tentativa e erro que aprende por meio de tentativas e erros constantes e feedback. Os algoritmos correspondentes incluem programação dinâmica, métodos de Monte Carlo, Q-Learning, TD-Learning e algoritmos Sarsa.

Perguntar à IA

Bookmark