Key points are not available for this paper at this time.
Der Multi-Armige Bandit ist ein wichtiges Rahmenwerk zur Balance zwischen Erkundung und Ausnutzung in Empfehlungen. Die Ausnutzung empfiehlt Inhalte (z.B. Produkte, Filme, Musik-Playlists) mit der höchsten vorhergesagten Nutzerbeteiligung und war traditionell der Fokus von Empfehlungssystemen. Die Erkundung empfiehlt Inhalte mit ungewisser vorhergesagter Nutzerbeteiligung, um mehr Informationen zu sammeln. Die Bedeutung der Erkundung wurde in den letzten Jahren erkannt, insbesondere in Umgebungen mit neuen Nutzern, neuen Gegenständen, nicht-stationären Präferenzen und Attributen. Parallel dazu ist die Erklärung von Empfehlungen („Recsplanationen“) entscheidend, wenn Nutzer ihre Empfehlungen verstehen sollen. Vorhandene Arbeiten haben Banditen und Erklärungen unabhängig betrachtet. Wir bieten die erste Methode an, die beides auf eine principielle Weise kombiniert. Insbesondere ist unsere Methode in der Lage, gemeinsam (1) zu lernen, auf welche Erklärungen jeder Nutzer reagiert; (2) den besten Inhalt für jeden Nutzer zu empfehlen; und (3) Erkundung mit Ausnutzung auszubalancieren, um mit Unsicherheit umzugehen. Experimente mit historischen Logdaten und Tests mit live Produktionsverkehr in einem großangelegten Musikempfehlungsdienst zeigen eine signifikante Verbesserung der Nutzerbeteiligung.
McInerney et al. (Thu,) haben diese Frage untersucht.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: