Key points are not available for this paper at this time.
Em áreas urbanas, a eficiência dos fluxos de tráfego depende em grande parte da operação dos sinais e a expansão da infraestrutura de sinal existente não é viável devido a restrições espaciais, econômicas e ambientais. Neste artigo, abordamos o problema da congestão nas interseções rodoviárias. Desenvolvemos nosso simulador de tráfego para simular de forma otimizada vários cenários de tráfego, intimamente relacionados às situações de tráfego do mundo real. Defendemos que a otimização adaptativa de tráfego em tempo real é a chave para melhorar a eficácia da infraestrutura existente, permitindo que o sistema de controle de tráfego aprenda, se adapte e evolua de acordo com o ambiente ao qual está exposto. Propomos uma abordagem baseada em visão, usando aprendizado profundo por reforço, fundamentada em um algoritmo de gradiente de política, para configurar políticas de controle de semáforos. O algoritmo é alimentado com informações de tráfego em tempo real e visa otimizar os fluxos de veículos que passam pelas interseções rodoviárias. Nossos resultados de testes preliminares demonstram que, em comparação com as metodologias de controle de semáforos baseadas em modelos previamente propostos, a configuração das políticas de semáforo através deste novo método é extremamente benéfica.
Garg et al. (Sat,) estudaram essa questão.