August 17, 2025

Aprendizaje en línea óptimo por tasa para la selección dinámica de surtidos con posicionamiento

Puntos clave

La eficiencia de aprendizaje óptima se logra a través del algoritmo TLR-UCB, permitiendo una generación de ingresos mejorada.
El uso de un modelo de logit multinomial muestra que la posición de exhibición del producto impacta significativamente en las elecciones de los clientes.
La política propuesta EI-TLR estima las preferencias de los clientes mientras aborda eficazmente los efectos de posicionamiento desconocidos.
Se observan mejoras significativas en las simulaciones de TLR-UCB y EI-TLR en comparación con los métodos tradicionales.

Resumen

Este estudio aborda un desafío clave en el comercio minorista en línea: el posicionamiento de productos. Los autores proponen un nuevo marco de aprendizaje en línea llamado selección dinámica de surtidos con posicionamiento (DAP). A diferencia de los modelos tradicionales que se centran únicamente en la selección de artículos, DAP también aprende la colocación óptima de productos para maximizar los ingresos. Los investigadores modelan las elecciones de los clientes utilizando un marco de logit multinomial, donde el atractivo del artículo depende tanto de la preferencia intrínseca como de la posición de exhibición. Demuestran que ignorar los efectos de la posición lleva a un rendimiento subóptimo e introducen un nuevo algoritmo, TLR-UCB, que incorpora eficazmente retroalimentación adaptativa dependiente de la posición a través de una estructura de bandido lineal geométrico y técnicas de regresión lineal truncadas. El análisis teórico confirma que TLR-UCB logra una eficiencia de aprendizaje óptima. Para manejar los efectos de posición desconocidos, desarrollan además EI-TLR, una política de dos etapas que estima conjuntamente las preferencias de los clientes y los impactos de posicionamiento antes de aplicar un procedimiento generalizado de TLR-UCB. Simulaciones extensas muestran que tanto TLR-UCB como EI-TLR superan significativamente los puntos de referencia existentes, ofreciendo herramientas poderosas para la optimización dinámica y basada en datos de surtidos y diseños en mercados en línea.

Me gusta

Guardar