Los puntos clave no están disponibles para este artículo en este momento.
Resumen La integración de vehículos aéreos no tripulados (UAV) con sistemas de comunicación ultra confiables y de baja latencia (URLLC) puede mejorar el rendimiento de comunicación en tiempo real para diversas aplicaciones del internet industrial de las cosas (IIoT). Diseñar un sistema inteligente de asignación de recursos es uno de los desafíos que plantea un sistema de comunicación UAV limitado en energía. Por lo tanto, formulamos un problema de maximización de la tasa total, sujeto a la energía de los UAV, optimizando conjuntamente la asignación de longitud de bloque y el control de potencia en los sistemas UAV asistidos por URLLC en el enlace ascendente, en los que se adopta el modelo de canal probabilístico entre el UAV y los usuarios. El problema es difícil de resolver debido a la función objetivo no convexa y las restricciones de energía, y también es un desafío tomar decisiones rápidas en un entorno de comunicación complejo. Así, proponemos un esquema basado en aprendizaje profundo por refuerzo (DRL) para optimizar conjuntamente la asignación de longitud de bloque y el control de potencia. Primero, transformamos el problema original en un proceso de aprendizaje por refuerzo multiagente, donde cada subportadora se considera como el agente que optimiza su asignación de longitud de bloque y control de potencia individualmente. Luego, cada agente toma la decisión inteligente de obtener el valor máximo de recompensa dependiendo de la función de recompensa segmentada ponderada, que está relacionada con el consumo de energía del UAV y las tasas de los usuarios para mejorar el rendimiento de la tasa. Finalmente, los resultados de la simulación muestran que el esquema propuesto supera a los esquemas de referencia y tiene una convergencia estable en diferentes configuraciones, como la tasa de aprendizaje, la probabilidad de error, el espaciado de subportadoras y el número de usuarios.
Li et al. (Mon,) estudiaron esta cuestión.