Este estudio aborda un desafío clave en el comercio minorista en línea: el posicionamiento de productos. Los autores proponen un nuevo marco de aprendizaje en línea llamado selección dinámica de surtidos con posicionamiento (DAP). A diferencia de los modelos tradicionales que se centran únicamente en la selección de artículos, DAP también aprende la colocación óptima de productos para maximizar los ingresos. Los investigadores modelan las elecciones de los clientes utilizando un marco de logit multinomial, donde el atractivo del artículo depende tanto de la preferencia intrínseca como de la posición de exhibición. Demuestran que ignorar los efectos de la posición lleva a un rendimiento subóptimo e introducen un nuevo algoritmo, TLR-UCB, que incorpora eficazmente retroalimentación adaptativa dependiente de la posición a través de una estructura de bandido lineal geométrico y técnicas de regresión lineal truncadas. El análisis teórico confirma que TLR-UCB logra una eficiencia de aprendizaje óptima. Para manejar los efectos de posición desconocidos, desarrollan además EI-TLR, una política de dos etapas que estima conjuntamente las preferencias de los clientes y los impactos de posicionamiento antes de aplicar un procedimiento generalizado de TLR-UCB. Simulaciones extensas muestran que tanto TLR-UCB como EI-TLR superan significativamente los puntos de referencia existentes, ofreciendo herramientas poderosas para la optimización dinámica y basada en datos de surtidos y diseños en mercados en línea.
Luo et al. (Mon,) estudiaron esta cuestión.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: