Los puntos clave no están disponibles para este artículo en este momento.
En los últimos años, el marco de los bandits de múltiples brazos (MAB) ha atraído mucha atención en diversas aplicaciones, desde sistemas de recomendación y recuperación de información hasta la atención médica y las finanzas, debido a su destacado rendimiento combinado con ciertas propiedades atractivas, como el aprendizaje a partir de menos retroalimentación. El campo de los bandits de múltiples brazos está actualmente floresciendo, ya que se están introduciendo nuevos entornos de problemas y algoritmos motivados por diversas aplicaciones prácticas, basándose en el problema clásico de los bandits. Este artículo tiene como objetivo proporcionar una revisión integral de los principales desarrollos recientes en múltiples aplicaciones de la vida real de los bandits de múltiples brazos. Específicamente, introducimos una taxonomía de aplicaciones comunes basadas en MAB y resumimos el estado del arte para cada uno de esos dominios. Además, identificamos tendencias actuales importantes y proporcionamos nuevas perspectivas relacionadas con el futuro de este emocionante y rápido campo en crecimiento.
Bouneffouf et al. (Tue,) estudiaron esta cuestión.