A Amostragem Posterior Otimista para Aprendizado por Reforço: Limites de Arrependimento no Pior Caso | Synapse