Key points are not available for this paper at this time.
O aprendizado por reforço é um tipo de aprendizado de máquina. Uma característica importante que o distingue de outros tipos de aprendizado é que o aprendizado por reforço usa informações de treinamento para avaliar as ações tomadas. A ação correta orienta a escolha da ação. O agente não é informado sobre qual ação deve ser realizada e qual ação não deve ser feita. Em vez disso, ele tenta descobrir qual ação pode produzir a máxima recompensa. Portanto, o aprendizado por reforço é um mecanismo de tentativa e erro que aprende por meio de tentativas e erros constantes e feedback. Os algoritmos correspondentes incluem programação dinâmica, métodos de Monte Carlo, Q-Learning, TD-Learning e algoritmos Sarsa.
Jia et al. (Sex,) estudaram esta questão.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: