Los puntos clave no están disponibles para este artículo en este momento.
Con el uso frecuente de la estimación de profundidad monocular auto-supervisada en robótica y conducción autónoma, la eficiencia del modelo se vuelve cada vez más importante. La mayoría de los enfoques actuales aplican redes mucho más grandes y complejas para mejorar la precisión de la estimación de profundidad. Algunos investigadores incorporaron Transformer en la estimación de profundidad monocular auto-supervisada para lograr un mejor rendimiento. Sin embargo, este método lleva a un alto número de parámetros y alta computación. Presentamos una red de estimación de profundidad completamente convolucional utilizando fusión de características contextuales. En comparación con UNet++ y HRNet, usamos características de alta resolución y baja resolución para reservar información sobre objetivos pequeños y objetos de rápido movimiento en lugar de fusión a larga distancia. Además, promovemos los resultados de estimación de profundidad empleando atención de canal ligera basada en convolución en la etapa del decodificador. Nuestro método reduce los parámetros sin sacrificar precisión. Experimentos en el benchmark KITTI muestran que nuestro método puede obtener mejores resultados que muchos modelos grandes, como Monodepth2, con solo el 30% de parámetros. El código fuente está disponible en https://github.com/boyagesmile/DNA-Depth.
Wang et al. (Mon,) estudiaron esta cuestión.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: