Los puntos clave no están disponibles para este artículo en este momento.
El artículo describe un posible algoritmo de aprendizaje por refuerzo profundo para el seguimiento de haz y la predicción del movimiento angular de los equipos de usuario. Se logra una alta precisión en la predicción de los ángulos de azimut y elevación mediante la aplicación de un método de aprendizaje avanzado: Optimización de Política Proximal. Para rastrear de manera más precisa la secuencia de coordenadas angulares que varían en el tiempo, se utilizan celdas de Memoria a Largo y Corto Plazo como una de las implementaciones de redes neuronales recurrentes. El enfoque propuesto no requiere ningún conocimiento a priori sobre el ambiente y puede implementarse en tiempo real.
Averina et al. (Mié,) estudiaron esta cuestión.