Key points are not available for this paper at this time.
Étant donné que les approches conventionnelles ne pouvaient pas s'adapter aux conditions de circulation dynamiques, l'apprentissage par renforcement (RL) a attiré plus d'attention pour aider à résoudre le problème du contrôle des signaux de circulation (TSC). Cependant, les méthodes basées sur le RL existantes sont rarement déployées car elles ne sont ni rentables en termes de ressources de calcul ni plus robustes que les approches traditionnelles, ce qui soulève une question de recherche critique : comment construire un contrôleur adaptatif pour le TSC avec moins d'entraînement et une complexité réduite basé sur l'approche basée sur le RL ? Pour répondre à cette question, dans cet article, nous (1) spécifions de manière innovante la représentation du mouvement du trafic comme une pression simple mais efficace des files de véhicules dans un réseau de circulation, à savoir la pression efficace (EP) ; (2) construisons un protocole de réglage des signaux de circulation, y compris la durée de phase, le nombre de phases de signal et l'EP pour le TSC ; (3) concevons une approche TSC basée sur l'approche traditionnelle de pression maximale (MP), à savoir pression maximale efficace (Efficient-MP) utilisant l'EP pour capturer l'état du trafic ; et (4) développons un modèle d'algorithme TSC basé sur le RL : efficient Xlight (Efficient-XLight) sous l'EP. À travers des expériences complètes sur plusieurs ensembles de données du monde réel dans notre protocole de réglage des signaux de circulation pour le TSC, nous démontrons que la pression efficace est complémentaire aux modélisations traditionnelles et basées sur le RL pour concevoir de meilleures méthodes de TSC. Notre code est publié sur Github.
Wu et al. (Sat,) ont étudié cette question.