Key points are not available for this paper at this time.
Die präzise Vorhersage der zukünftigen Bewegungen umgebender Verkehrsagenten ist entscheidend für die Sicherheit autonomer Fahrzeuge. In letzter Zeit haben vektorisierte Ansätze die Gemeinschaft der Bewegungsprognose dominiert, da sie in der Lage sind, komplexe Wechselwirkungen in Verkehrsszenarien zu erfassen. Bestehende Methoden vernachlässigen jedoch die Symmetrien des Problems und leiden unter hohen Rechenkosten, da sie vor der Herausforderung stehen, eine Echtzeit-Mehrrundenbewegungsprognose zu erstellen, ohne die Vorhersageleistung zu opfern. Um diese Herausforderung zu bewältigen, schlagen wir den Hierarchical Vector Transformer (HiVT) für eine schnelle und genaue Mehr-Agenten Bewegungsprognose vor. Durch die Zerlegung des Problems in lokale Kontextextractierung und globale Interaktionsmodellierung kann unser Ansatz eine große Anzahl von Agenten in der Szene effektiv und effizient modellieren. Gleichzeitig schlagen wir eine translationsinvariante Szenenrepräsentation und rotationsinvariante räumliche Lernmodule vor, die Merkmale extrahieren, die robust gegenüber geometrischen Transformationen der Szene sind und es dem Modell ermöglichen, genaue Vorhersagen für mehrere Agenten in einem einzigen Vorwärtsdurchlauf zu treffen. Experimente zeigen, dass HiVT die derzeitige Bestleistung im Argoverse Bewegungsprognose-Benchmark mit einer kleinen Modellgröße erreicht und schnelle Mehr-Agenten Bewegungsprognosen machen kann.
Zhou et al. (Wed,) haben diese Frage untersucht.
Synapse has enriched 3 closely related papers on similar clinical questions. Consider them for comparative context: