Key points are not available for this paper at this time.
Das tiefgreifende Lernen mit 3D-Daten hat seit der Einführung von Convolutional Neural Networks, die mit der Unschärfe der Punktreihenfolge in Punktwolkendaten umgehen können, erheblich fortgeschritten. Während es möglich ist, gute Genauigkeiten in verschiedenen Aufgaben des Szenenverständnisses zu erzielen, haben frühere Methoden oft eine niedrige Trainingsgeschwindigkeit und eine komplexe Netzwerkarchitektur. In diesem Papier gehen wir auf diese Probleme ein, indem wir eine effiziente End-to-End-Permutationsinvariante Convolution für das tiefgreifende Lernen von Punktwolken vorschlagen. Unser einfacher, aber effektiver Convolution-Operator namens ShellConv nutzt Statistiken von konzentrischen sphärischen Schalen, um repräsentative Merkmale zu definieren und die Unschärfe der Punktreihenfolge zu lösen, wodurch die traditionelle Convolution auf solchen Merkmalen arbeiten kann. Basierend auf ShellConv bauen wir weiter ein effizientes neuronales Netzwerk namens ShellNet auf, das direkt die Punktwolken mit größeren rezeptiven Feldern konsumiert, während es weniger Schichten beibehält. Wir demonstrieren die Wirksamkeit von ShellNet, indem wir Ergebnisse auf dem Stand der Technik in der Objektklassifikation, Segmentierung von Objektteilen und semantischer Szenensegmentierung erzielen und gleichzeitig das Netzwerk sehr schnell trainierbar bleibt.
Zhang et al. (Tue,) untersuchten diese Frage.