Los puntos clave no están disponibles para este artículo en este momento.
Los Vehículos Aéreos No Tripulados (UAVs) se están utilizando cada vez más en muchas aplicaciones desafiantes y diversificadas. Mientras tanto, la capacidad de los UAV para la navegación autónoma y la evitación de obstáculos se vuelve cada vez más crítica. Este artículo se centra en llenar el vacío entre la teoría del aprendizaje por refuerzo profundo (DRL) y la aplicación práctica al involucrar un mecanismo de atención y un mecanismo jerárquico para resolver algunos problemas severos que se encuentran en la aplicación práctica de DRL. Más específicamente, para mejorar la robustez del DRL, utilizamos una función de estimación promedio en lugar de la función de estimación de valor normal. A continuación, diseñamos una red recurrente y un mecanismo de atención temporal para mejorar el rendimiento del algoritmo. Tercero, proponemos un marco jerárquico para mejorar su rendimiento en tareas a largo plazo. Se utilizan algunos entornos de simulación realistas, así como el mundo real, para evaluar el método propuesto de navegación autónoma de UAV. Los resultados demuestran que nuestro método de navegación basado en DRL funciona bien en diferentes entornos y supera el algoritmo DrQ original.
Liu et al. (Fri,) estudiaron esta cuestión.
Synapse has enriched 2 closely related papers on similar clinical questions. Consider them for comparative context: