Key points are not available for this paper at this time.
A estimativa de distância usando uma câmera monocular é uma das tarefas mais clássicas para visão computacional. Os métodos atuais de estimativa de distância monocular precisam de muita coleta de dados ou produzem resultados imprecisos. Neste artigo, propomos uma rede para detecção de objetos e estimativa de distância. Uma rede baseada em ShuffleNet e YOLO é usada para detectar um objeto, e uma rede de aprendizado auto-supervisionado é utilizada para estimar a distância. Calibramos a câmera, e os parâmetros calibrados foram integrados na rede geral. Também analisamos a variação dos parâmetros da pose da câmera. Além disso, uma resolução em múltiplas escalas é aplicada para melhorar a precisão da estimativa, enriquecendo a capacidade de expressão da informação de profundidade. Validamos os resultados da detecção de objetos e da estimativa de distância no conjunto de dados KITTI e demonstramos que nossa abordagem é eficiente e precisa. Finalmente, construímos um conjunto de dados e realizamos experimentos semelhantes para verificar a generalidade da rede em outros cenários. Os resultados mostram que nossos métodos propostos superam abordagens alternativas na estimativa de distância específica de objetos.
Hong et al. (Ter,) estudaram esta questão.