Los puntos clave no están disponibles para este artículo en este momento.
La quinta generación de comunicaciones inalámbricas (5G) promete aumentos masivos en el volumen de tráfico y las tasas de datos, así como una mayor fiabilidad en las llamadas de voz. Optimizar conjuntamente la formación de haz, el control de potencia y la coordinación de interferencias en una red inalámbrica 5G para mejorar el rendimiento de la comunicación hacia los usuarios finales presenta un desafío significativo. En este artículo, formulamos el diseño conjunto de la formación de haz, el control de potencia y la coordinación de interferencias como un problema de optimización no convexo para maximizar la relación de señal a interferencia más ruido (SINR) y resolvemos este problema utilizando aprendizaje por refuerzo profundo. Al usar la naturaleza codiciosa del aprendizaje Q profundo para estimar las recompensas futuras de las acciones y utilizando las coordenadas reportadas de los usuarios atendidos por la red, proponemos un algoritmo para portadores de voz y portadores de datos en bandas de frecuencia sub-6 GHz y de ondas milimétricas (mmWave), respectivamente. El algoritmo mejora el rendimiento medido por SINR y la capacidad de suma. En entornos celulares realistas, los resultados de la simulación muestran que nuestro algoritmo supera los estándares de adaptación de enlace de la industria para portadores de voz sub-6 GHz. Para los portadores de datos en la banda de frecuencia mmWave, nuestro algoritmo se acerca a la capacidad máxima de tasa de suma, pero con menos del 4% del tiempo de ejecución requerido.
Mismar et al. (Tue,) estudiaron esta cuestión.