Los robots humanoides son prometedores para adquirir diversas habilidades mediante la imitación de comportamientos humanos. Sin embargo, los algoritmos existentes solo son capaces de rastrear movimientos humanos suaves y de baja velocidad, incluso con un diseño cuidadoso de recompensas y currículos. Este artículo presenta un marco de control humanoide basado en física, que tiene como objetivo dominar comportamientos humanos altamente dinámicos como el Kungfu y la danza mediante un procesamiento de movimientos en varios pasos y seguimiento de movimiento adaptativo. Para el procesamiento del movimiento, diseñamos una tubería para extraer, filtrar, corregir y redirigir movimientos, asegurando el cumplimiento de las restricciones físicas en la máxima medida. Para la imitación del movimiento, formulamos un problema de optimización de dos niveles para ajustar dinámicamente la tolerancia de precisión del seguimiento basado en el error de seguimiento actual, creando un mecanismo de currículo adaptativo. Además, construimos un marco asimétrico de actor-crítico para el entrenamiento de políticas. En experimentos, entrenamos políticas de control de cuerpo completo para imitar un conjunto de movimientos altamente dinámicos. Nuestro método logra errores de seguimiento significativamente menores que los enfoques existentes y se implementa con éxito en el robot Unitree G1, demostrando comportamientos estables y expresivos. La página del proyecto es https://kungfu-bot.github.io.
Xie et al. (Sun,) estudiaron esta cuestión.