Key points are not available for this paper at this time.
Der Bau animierbarer 3D-Modelle ist herausfordernd, da 3D-Scans, mühsame Registrierung und Rigging erforderlich sind. Kürzlich bietet differentielles Rendering einen Weg, um hochwertige 3D-Modelle aus monokularen Videos zu erhalten, aber diese sind auf starre Kategorien oder Einzelinstanzen beschränkt. Wir präsentieren RAC, eine Methode, um kategorienbasierte 3D-Modelle aus monokularen Videos zu erstellen, die Variationen über Instanzen und Bewegungen über die Zeit entflechtet. Drei Hauptideen werden vorgestellt, um dieses Problem zu lösen: (1) Spezialisierung eines kategorienbasierten Skeletts auf Instanzen, (2) eine Methode zur Regularisierung des latenten Raums, die eine geteilte Struktur innerhalb einer Kategorie fördert und dabei Instanzdetails beibehält, und (3) Verwendung von 3D-Hintergrundmodellen, um Objekte vom Hintergrund zu entflechten. Wir erstellen 3D-Modelle für Menschen, Katzen und Hunde aus monokularen Videos. Projektseite: https://gengshan-y.github.io/rac-www/.
Yang et al. (Thu,) haben diese Frage untersucht.