October 23, 2022Open Access

온라인 다중 접촉 후퇴 지평 계획을 안내하는 학습

Key Points

Key points are not available for this paper at this time.

Abstract

후퇴 지평 계획(Receding Horizon Planning, RHP)에서는 실행되는 움직임이 작업 완료를 촉진하는 것이 중요합니다. 예를 들어, 큰 장애물을 극복하기 위한 모멘텀을 구축하는 것입니다. 이는 로봇 상태의 바람직함을 알리기 위한 가치 함수가 필요합니다. 그러나 복잡한 역학을 고려할 때, 가치 함수는 종종 확장된 계획 지평선에서 궤적의 비싼 계산에 의해 근사됩니다. 본 연구에서는 온라인 다중 접촉 후퇴 지평 계획(RHP)을 달성하기 위해 현재 로봇 상태와 환경에 따라 주어진 작업을 위한 로컬 목표(중간 목표)를 예측할 수 있는 오라클을 학습할 것을 제안합니다. 그런 다음 이러한 로컬 목표를 사용하여 단기 후퇴 지평 계획을 안내하기 위한 로컬 가치 함수를 구성합니다. 오라클을 얻기 위해 감독 학습 접근 방식을 채택하고, 실패로부터 회복하는 방법에 대한 시연을 추가하여 예측 정확성을 개선할 수 있는 점진적 훈련 계획을 제시합니다. 우리는 중간 경사와 정적 안정성이 달성될 수 없는 큰 경사에서의 휴머노이드 걷기의 중심 궤적 계획을 위해 우리의 접근 방식과 기준선(장기 지평 RHP)을 비교합니다. 우리는 전체 역학 역전 컨트롤러를 통해 시뮬레이션에서 이러한 궤적을 추적하여 검증합니다. 우리의 접근 방식은 95%-98.6% 주기의 온라인 RHP를 달성할 수 있으며, 기준선(8%-51.2%)을 능가하는 것을 나타냅니다.

AI에게 질문

Bookmark

View Full Paper