Imitationslernen ist ein vielversprechendes Paradigma für das Training von Roboteragenten; jedoch erfordern standardmäßige Ansätze typischerweise umfangreiche Datenerfassung – durch zahlreiche Demonstrationen oder zufällige Erkundung – um eine zuverlässige Leistung sicherzustellen. Obwohl Erkundung den menschlichen Aufwand reduziert, fehlen ihr Sicherheitsgarantien, und sie führt häufig zu Kollisionen – besonders bei auf Platz begrenzten Aufgaben (z. B. Stift-in-Loch) – wodurch manuelle Umgebungsresets notwendig werden und zusätzliche menschliche Belastung entsteht. Diese Studie schlägt Self-Augmented Robot Trajectory (SART) vor, ein Framework, das das Lernen von Politiken aus einer einzigen menschlichen Demonstration ermöglicht, während es den Datensatz durch autonome Augmentierung sicher erweitert. SART besteht aus zwei Phasen: (1) einmaliges menschliches Anleiten, bei dem eine einzelne Demonstration gegeben wird und Präzisionsgrenzen – dargestellt als Kugeln um Schlüsselwegpunkte – annotiert werden, gefolgt von einem Umgebungsreset; (2) robotisches Selbstaugmentieren, bei dem der Roboter innerhalb dieser Grenzen vielfältige, kollisionsfreie Trajektorien erzeugt und an die ursprüngliche Demonstration anknüpft. Dieses Design verbessert die Effizienz der Datenerfassung durch Minimierung menschlichen Aufwands bei gleichzeitiger Gewährleistung von Sicherheit. Umfangreiche Bewertungen in Simulationen und realen Manipulationsaufgaben zeigen, dass SART deutlich höhere Erfolgsraten erzielt als Politiken, die ausschließlich auf menschlich gesammelten Demonstrationen trainiert wurden. Videoergebnisse sind verfügbar unter https://sites.google.com/view/sart-il.
Oh et al. (Do,) haben diese Fragestellung untersucht.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: