What type of study is this?

This is a Quantitative Study study.

October 20, 2025Open Access

Optimierung der Ressourcenallokation in heterogenen drahtlosen Netzwerken mithilfe von Deep Reinforcement Learning

Key Points

Deep Reinforcement Learning-Rahmenwerke übertreffen heuristische Algorithmen bei der Verwaltung der Ressourcenallokation.
Unsere Ergebnisse zeigen einen verbesserten Durchsatz und eine höhere Energieeffizienz in heterogenen drahtlosen Netzwerken durch den Einsatz von DRL.
Proximal Policy Optimisation und TD3 werden gegenüber drei heuristischen Methoden in verschiedenen Netzwerkszenarien verglichen.
Die Ergebnisse betonen die Bedeutung des Ausgleichs von Durchsatz, Energieeffizienz und Fairness in zukünftigen HetNet-Designs.

Abstract

Die dynamische Ressourcenallokation in heterogenen drahtlosen Netzwerken (HetNets) ist für traditionelle Methoden bei wechselnden Benutzerlasten und Kanalkonditionen herausfordernd. Wir schlagen ein Deep Reinforcement Learning (DRL)-Rahmenwerk vor, das die Übertragungsleistung, Bandbreite und Zeitplanung gemeinsam optimiert, indem es einen mehrzieligen Belohnungsansatz zur Balance von Durchsatz, Energieeffizienz und Fairness verwendet. Anhand realer Basisstation-Koordinaten vergleichen wir Proximal Policy Optimisation (PPO) und Twin Delayed Deep Deterministic Policy Gradient (TD3) mit drei heuristischen Algorithmen in mehreren Netzwerkszenarien. Unsere Ergebnisse zeigen, dass DRL-Rahmenwerke besser abschneiden als heuristische Algorithmen bei der Optimierung der Ressourcenallokation in dynamischen Netzwerken. Diese Ergebnisse heben wichtige Abwägungen im DRL-Design für zukünftige HetNets hervor.

Optimierung der Ressourcenallokation in heterogenen drahtlosen Netzwerken mithilfe von Deep Reinforcement Learning

Key Points

Abstract

Cite This Study

Also Consider

Also Consider