Resumo O reconhecimento de sinais de trânsito desempenha um papel crítico no desenvolvimento de sistemas de direção autônoma e redes de transporte inteligentes. No entanto, detectar sinais de trânsito pequenos em cenários do mundo real, particularmente aqueles capturados por câmeras montadas em veículos, continua a ser um desafio significativo devido ao seu tamanho diminuto, baixa resolução e ruído ambiental. Para abordar esses desafios, propomos uma inovadora estrutura de aprimoramento multi-estratégia para o YOLOv7, projetada especificamente para melhorar a detecção de pequenos alvos. A estrutura integra várias técnicas inovadoras: o mecanismo de atenção SE é incorporado no módulo ELAN da rede backbone para aumentar a discriminabilidade das características; o DySample substitui métodos tradicionais de upsampling na rede cabeça para refinar a reconstrução de características; a perda NWD é introduzida como uma alternativa superior à perda CIoU, melhorando a precisão de localização de pequenos objetos; e a convolução PConv é aplicada para reduzir os parâmetros do modelo sem sacrificar o desempenho. Resultados experimentais no dataset CCTSDB-2021 demonstram a eficácia desses aprimoramentos, com mAP@0.5 e mAP@0.5:0.95 melhorando em 6.6 e 15.2 %, respectivamente, em comparação com o modelo original YOLOv7. O algoritmo proposto supera o YOLOv7 em 10.9 % em mAP@0.5 e 11.89 % em mAP@0.5:0.95 no dataset TT100K. Além disso, o modelo otimizado alcança inferência em tempo real a 83 FPS no dataset CCTSDB-2021, enquanto reduz o número de parâmetros em 1.5 milhões, tornando-o altamente eficiente para implantação prática em veículos autônomos. Essas melhorias não apenas aumentam a precisão da detecção, mas também atendem aos requisitos de processamento em tempo real de sistemas de transporte inteligentes.
Lin et al. (Thu,) estudaram esta questão.