Key points are not available for this paper at this time.
Zusammenfassung In diesem Papier präsentieren wir einen neuen Ansatz zur Lösung des Problems des Lernens von Motorprimitive, der Ideen aus der statistischen Verallgemeinerung und dem Fehlerlernen kombiniert. Das Lernverfahren wird in zwei Phasen formuliert. Die erste Phase basiert auf der Verallgemeinerung bereits gelernter Bewegungen, die mit einer spezifischen Aufgabenstellung verbunden sind, was zu einer ersten Annäherung an eine geeignete Steuerpolitik in einer neuen Situation führt. Die zweite Phase wendet das Lernen im Unterraum an, der durch die zuvor erworbenen Trainingsdaten definiert ist, was zu einem Lernproblem im beschränkten Bereich führt. Wir zeigen, dass Verstärkungslernen im beschränkten Bereich als ein Fehlerlernalgorithmus interpretiert werden kann. Darüber hinaus schlagen wir Modifikationen vor, um den Lernprozess zu beschleunigen. Der vorgeschlagene Ansatz wurde sowohl in Simulation als auch experimentell bei zwei herausfordernden Aufgaben getestet: dem Lernen des Aufklappens einer Zündholzschachtel und dem Ausgießen.
Nemec et al. (Tue,) haben diese Frage untersucht.