Key points are not available for this paper at this time.
추천 시스템은 사용자의 일상적인 요구를 충족하는 것을 목표로 합니다. 기존 연구의 대부분은 사용자의 시스템 참여를 최대화하는 데 집중하고 있지만, 사용자가 서비스를 위해 얼마나 자주 돌아오는지도 추천의 질과 안정성을 반영한다는 점이 최근에 지적되었습니다. 그러나 이러한 사용자 유지 행동을 최적화하는 것은 간단하지 않으며, 다루기 어려운 이탈 및 복귀 사용자 활동, 희소하고 지연된 신호, 사용자의 유지와 추천 목록의 각 항목에 대한 즉각적인 피드백 사이의 불확실한 관계 등 여러 가지 도전 과제를 제기합니다. 본 연구에서는 유지 신호를 사용자의 세션 종료 만족도의 전반적인 추정치로 간주하고 이 신호를 확률적 흐름을 통해 추정할 것을 제안합니다. 이 흐름 기반 모델링 기법은 사용자 세션에서 각 추천 항목에 대해 유지 보상을 역전파할 수 있으며, 전통적인 학습-순위 목표와 결합된 흐름이 최종적으로 즉각적인 사용자 피드백과 사용자 유지를 위한 비할인 누적 보상을 최적화한다는 것을 보여줍니다. 우리는 두 개의 공개 데이터 세트에 대한 오프라인 경험적 연구와 산업 플랫폼에서의 온라인 A/B 테스트를 통해 우리의 방법의 효과를 검증합니다.
Liu et al. (Sat,)은 이 질문을 연구했습니다.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: