Los puntos clave no están disponibles para este artículo en este momento.
Proponemos un procedimiento adaptativo simple para jugar un juego. En este, los jugadores se apartan de su juego actual con probabilidades que son proporcionales a medidas de arrepentimiento por no haber utilizado otras estrategias (estas medidas se actualizan cada período). Se muestra que nuestra adaptación garantiza que con probabilidad uno, las distribuciones muestrales del juego convergen al conjunto de equilibrios correlacionados del juego. Para estas medidas de arrepentimiento, un jugador necesita conocer su función de pago y la historia del juego. También ofrecemos una variación donde cada jugador solo tiene su propia historia de pagos realizados (pero no su función de pago).
Hart et al. (Fri,) estudiaron esta cuestión.