Feedback facial para aprendizado por reforço: um estudo de caso e análise offline usando a estrutura TAMER | Synapse