O paradigma bayesiano oferece ferramentas fundamentadas para a tomada de decisão sequencial sob incerteza, mas sua dependência de um modelo probabilístico para todos os parâmetros pode dificultar a incorporação de restrições estruturais complexas. Introduzimos uma estrutura bayesiana minimalista que aplica um prior apenas ao componente de interesse, como a localização do ótimo. Parâmetros indesejados são eliminados por meio da verossimilhança de perfil, que lida naturalmente com restrições. Como uma instanciação direta, desenvolvemos um algoritmo de Amostragem Thompson Minimalista (MINTS). Nossa estrutura acomoda problemas estruturados, incluindo bandidos de Lipschitz com braços contínuos e precificação dinâmica. Ela também fornece uma perspectiva probabilística sobre algoritmos clássicos de otimização convexa, como os métodos do centro de gravidade e elipsoide. Analisamos ainda o MINTS para bandidos de múltiplos braços e estabelecemos garantias de arrependimento quase ótimas.
Kaizheng Wang (Sun,) estudou esta questão.