What type of study is this?

This is a Quantitative Study study (also classified as: Experimental Study).

October 8, 2025Open Access

MPC mejorado por aprendizaje jerárquico para navegación segura de multitudes con restricciones heterogéneas

Puntos clave

El método aborda efectivamente la planificación local en entornos dinámicos complejos, logrando un rendimiento de vanguardia.
Las simulaciones y pruebas en el mundo real muestran una mejor eficiencia computacional en comparación con métodos tradicionales.
Un novedoso mecanismo de enmascaramiento de acciones soporta el entrenamiento de extremo a extremo, mejorando la robustez contra restricciones heterogéneas.
El planificador propuesto elimina la necesidad de simulaciones de alta fidelidad, haciéndolo escalable para diversas aplicaciones.

Resumen

En este documento, proponemos un nuevo marco jerárquico para la navegación de robots en entornos dinámicos con restricciones heterogéneas. Nuestro enfoque aprovecha una red neuronal gráfica entrenada mediante aprendizaje por refuerzo (RL) para estimar eficientemente el costo de ir del robot, formulado como recomendaciones de objetivos locales. Luego se emplea un módulo de búsqueda de trayectorias espacio-temporales, que tiene en cuenta las restricciones cinemáticas, para generar una trayectoria de referencia que facilite la resolución del problema de optimización no convexo utilizado para la imposición explícita de restricciones. Más importante aún, introducimos un mecanismo de enmascaramiento de acciones incremental y una estrategia de aprendizaje privilegiado, que permite el entrenamiento de extremo a extremo del planificador propuesto. Tanto las simulaciones como los experimentos en el mundo real demuestran que el método propuesto aborda efectivamente la planificación local en entornos dinámicos complejos, logrando un rendimiento de vanguardia (SOTA). En comparación con los métodos híbridos de aprendizaje-optimización existentes, nuestro enfoque elimina la dependencia de entornos de simulación de alta fidelidad, ofreciendo ventajas significativas en eficiencia computacional y escalabilidad de entrenamiento. El código será liberado como código abierto tras la aceptación del artículo.

Leer artículo completoexternamente

Preguntar a la IA

Me gusta

Guardar

Ver artículo completo