Key points are not available for this paper at this time.
In diesem Papier präsentieren wir den Latent Regression Forest (LRF), ein neuartiges Framework zur Echtzeit-3D-Handpose-Schätzung aus einem einzelnen Tiefenbild. Im Gegensatz zu früheren waldbasierten Methoden, die dichte Pixel als Eingabe verwenden, diese unabhängig klassifizieren und dann die Gelenkpositionen schätzen, kann unsere Methode als eine strukturierte Grob-zu-Fineste-Suche betrachtet werden, die vom Schwerpunkt einer Punktwolke ausgeht und alle Skelettgelenke lokalisiert. Der Suchprozess wird von einem gelernten Latent Tree Model geleitet, das die hierarchische Topologie der Hand widerspiegelt. Unsere Hauptbeiträge lassen sich wie folgt zusammenfassen: (i) Lernen der Topologie der Hand in einer unüberwachten, datengestützten Weise. (ii) Ein neues waldbasiertes, diskriminatives Framework für strukturierte Suchen in Bildern sowie einen Fehlerregressionsschritt, um Fehlerakkumulation zu vermeiden. (iii) Ein neuer Multi-View-Handpose-Datensatz, der 180K annotierte Bilder von 10 verschiedenen Probanden enthält. Unsere Experimente zeigen, dass der LRF die aktuellen Methoden sowohl in Bezug auf Genauigkeit als auch auf Effizienz übertrifft.
Tang et al. (Sun,) haben diese Frage untersucht.