What type of study is this?

This is a Quantitative Study study.

September 30, 2025Open Access

Selbstverstärkte Robotertrajektorie: Effizientes Imitationslernen durch sicheres Selbst-Augmentieren mit Demonstrator-annotierter Präzision

Key Points

Selbstverstärkte Robotertrajektorien führen zu höheren Erfolgsraten im Vergleich zu traditionellen Imitationslernmethode.
In Simulationen und realen Aufgaben reduziert SART den Bedarf an umfangreichen menschlichen Demonstrationen signifikant.
Das Framework erzeugt sicher vielfältige Trajektorien, um das Politiklernen ohne häufige Kollisionen zu verbessern.
Die Minimierung menschlichen Aufwands bei gleichzeitiger Gewährleistung von Sicherheit ist entscheidend für effektives Robotiktraining bei platzbegrenzten Aufgaben.

Abstract

Imitationslernen ist ein vielversprechendes Paradigma für das Training von Roboteragenten; jedoch erfordern standardmäßige Ansätze typischerweise umfangreiche Datenerfassung – durch zahlreiche Demonstrationen oder zufällige Erkundung – um eine zuverlässige Leistung sicherzustellen. Obwohl Erkundung den menschlichen Aufwand reduziert, fehlen ihr Sicherheitsgarantien, und sie führt häufig zu Kollisionen – besonders bei auf Platz begrenzten Aufgaben (z. B. Stift-in-Loch) – wodurch manuelle Umgebungsresets notwendig werden und zusätzliche menschliche Belastung entsteht. Diese Studie schlägt Self-Augmented Robot Trajectory (SART) vor, ein Framework, das das Lernen von Politiken aus einer einzigen menschlichen Demonstration ermöglicht, während es den Datensatz durch autonome Augmentierung sicher erweitert. SART besteht aus zwei Phasen: (1) einmaliges menschliches Anleiten, bei dem eine einzelne Demonstration gegeben wird und Präzisionsgrenzen – dargestellt als Kugeln um Schlüsselwegpunkte – annotiert werden, gefolgt von einem Umgebungsreset; (2) robotisches Selbstaugmentieren, bei dem der Roboter innerhalb dieser Grenzen vielfältige, kollisionsfreie Trajektorien erzeugt und an die ursprüngliche Demonstration anknüpft. Dieses Design verbessert die Effizienz der Datenerfassung durch Minimierung menschlichen Aufwands bei gleichzeitiger Gewährleistung von Sicherheit. Umfangreiche Bewertungen in Simulationen und realen Manipulationsaufgaben zeigen, dass SART deutlich höhere Erfolgsraten erzielt als Politiken, die ausschließlich auf menschlich gesammelten Demonstrationen trainiert wurden. Videoergebnisse sind verfügbar unter https://sites.google.com/view/sart-il.

Read Full Paperexternally

KI fragen

Bookmark

View Full Paper