Key points are not available for this paper at this time.
Les systèmes de recommandation apprennent les préférences personnalisées des utilisateurs à partir de leurs retours, comme les clics. Cependant, les retours des utilisateurs sont généralement biaisés vers des intérêts partiellement observés, laissant de nombreux intérêts cachés des utilisateurs inexploités. Les approches existantes atténuent généralement le biais, augmentent la diversité des recommandations, ou utilisent des algorithmes de bandit pour équilibrer les compromis exploration-exploitation. Néanmoins, elles ne tiennent pas compte des récompenses potentielles de la recommandation de différentes catégories d'articles et manquent de planification globale pour allouer les meilleures recommandations aux catégories, conduisant à une exploration sous-optimale. Dans ce travail, nous proposons un cadre basé sur un modèle d'Uplift Recommender (UpliftRec), qui considère les meilleures recommandations comme un problème d'optimisation de traitement. UpliftRec estime les effets du traitement, c'est-à-dire le taux de clics (CTR) sous différents rapports d'exposition aux catégories, en utilisant les retours d'utilisateur observables. UpliftRec calcule les effets de traitement au niveau des groupes pour découvrir les intérêts cachés des utilisateurs avec des récompenses CTR élevées et utilise le poids d'inverse de propension pour atténuer le biais de confusion. Ensuite, UpliftRec adopte une méthode de programmation dynamique pour calculer le traitement optimal pour la maximisation du CTR global. Nous mettons en œuvre UpliftRec sur différents modèles en arrière-plan et menons des expériences approfondies sur trois ensembles de données. Les résultats empiriques valident l'efficacité d'UpliftRec dans la découverte des intérêts cachés des utilisateurs tout en atteignant une précision de recommandation supérieure.
Chen et al. (Mercredi) ont étudié cette question.