Key points are not available for this paper at this time.
Punktwolken, die in realen Anwendungen erfasst werden, sind oft unvollständig aufgrund der begrenzten Sensorauflösung, eines einzelnen Blickwinkels und Okklusion. Daher wird es zu einer unverzichtbaren Aufgabe in vielen praktischen Anwendungen, die vollständigen Punktwolken aus teilweisen wiederherzustellen. In diesem Papier präsentieren wir eine neue Methode, die die Punktwolkenvollständigung als ein Set-zu-Set-Übersetzungsproblem reformuliert und ein neues Modell entwirft, das PoinTr genannt wird und eine Encoder-Decoder-Architektur auf Basis von Transformern für die Punktwolkenvollständigung verwendet. Indem wir die Punktwolke als ein Set von ungeordneten Punktgruppen mit Positions-Embeddings darstellen, konvertieren wir die Punktwolke in eine Sequenz von Punktproxies und verwenden die Transformer zur Generierung von Punktwolken. Um es den Transformern zu ermöglichen, die induktive Voreingenommenheit über 3D-geometrische Strukturen der Punktwolken besser zu nutzen, entwickeln wir zusätzlich einen geometriebewussten Block, der die lokalen geometrischen Beziehungen explizit modelliert. Die Migration der Transformer ermöglicht es unserem Modell, strukturelles Wissen besser zu erlernen und detaillierte Informationen für die Punktwolkenvollständigung zu bewahren. Darüber hinaus schlagen wir zwei herausforderndere Benchmarks mit vielfältigeren unvollständigen Punktwolken vor, die die realen Szenarien besser widerspiegeln und die zukünftige Forschung fördern können. Experimentelle Ergebnisse zeigen, dass unsere Methode die derzeit besten Methoden bei weitem übertrifft, sowohl bei den neuen Benchmarks als auch bei den bestehenden. Der Code ist verfügbar unter https://github.com/yuxumin/PoinTr.
Yu et al. (Do.) haben diese Frage untersucht.