Los puntos clave no están disponibles para este artículo en este momento.
La Localización y Mapeo Simultáneo Visual (vSLAM) es una técnica ampliamente utilizada en robótica y visión por computadora que permite a un robot crear un mapa de un entorno desconocido utilizando un sensor de cámara mientras rastrea simultáneamente su posición a lo largo del tiempo. En este artículo, proponemos un nuevo algoritmo vSLAM RGBD que puede aprender una geometría 3D densa y eficiente en memoria, y una segmentación semántica de una escena interior de manera en línea. Nuestro flujo de trabajo combina el seguimiento basado en visión 3D clásica y el cierre de bucles con el mapeo basado en campos neuronales. La red de mapeo aprende el SDF de la escena, así como mapas RGB, de profundidad y semánticos de cualquier vista nueva utilizando solo un conjunto de fotogramas clave. Además, ampliamos nuestro flujo de trabajo a escenas grandes utilizando múltiples redes de mapeo local. Experimentos extensos en conjuntos de datos de referencia bien conocidos confirman que nuestro enfoque proporciona un seguimiento robusto, mapeo y etiquetado semántico incluso con profundidad de entrada ruidosa, escasa o inexistente. En general, nuestro algoritmo propuesto puede mejorar en gran medida la percepción de la escena y ayudar con una variedad de problemas de control robotizado.
Haghighi et al. (Jue,) estudiaron esta cuestión.