Key points are not available for this paper at this time.
Construir um modelo 3D completo de uma cena, dado apenas uma única imagem de profundidade, é subdeterminado. Para obter um modelo volumétrico completo, é necessário ter múltiplas vistas, ou uma única vista juntamente com uma biblioteca de modelos 3D inequívocos que se encaixem na forma de cada objeto individual na cena. Hipotetizamos que objetos de classes semânticas diferentes frequentemente compartilham componentes de forma 3D similares, permitindo que um conjunto de dados limitado modele a forma de uma ampla gama de objetos e, assim, estime sua geometria oculta. Explorando essa hipótese, propomos um algoritmo que pode completar a geometria não observada de objetos do tamanho de uma mesa, baseado em um modelo supervisionado treinado em elementos volumétricos já disponíveis. Nosso modelo mapeia a partir de uma observação local em uma única imagem de profundidade para uma estimativa da forma da superfície na vizinhança circundante. Validamos nossa abordagem tanto qualitativamente quanto quantitativamente em uma variedade de coleções de objetos internos e cenas reais desafiadoras.
Firman et al. (Wed,) estudaram essa questão.