Key points are not available for this paper at this time.
In diesem Papier untersuchen wir ein Kommunikationssystem mit mehreren Empfängern, das durch bewegliche Antennen (MAs) ermöglicht wird. Konkret werden das Overhead-Beamforming und die doppelseitige Antennenbewegung am Transceiver gemeinsam gestaltet, um die Gesamtrate aller Empfänger unter unvollständiger Kanalzustandsinformation (CSI) zu maximieren. Da das formulierte Problem nicht-konvex ist und stark gekoppelte Variablen enthält, können herkömmliche Optimierungsmethoden es nicht effizient lösen. Um diese Herausforderungen anzugehen, wird ein effektiver lernbasierter Algorithmus vorgeschlagen, nämlich heterogene Multi-Agenten tiefe deterministische Policy-Gradienten (MADDPG), der zwei Agenten einbezieht, um Richtlinien für Beamforming und Bewegung der MAs zu lernen. Basierend auf dem Offline-Lernen unter zahlreichen unvollkommenen CSIs kann das vorgeschlagene heterogene MADDPG die Lösungen für das Overhead-Beamforming und die Antennenbewegung in Echtzeit ausgeben. Simulationsergebnisse bestätigen die Wirksamkeit des vorgeschlagenen Algorithmus, und die MA kann die Gesamtratenleistung mehrerer Empfänger im Vergleich zu anderen Benchmark-Schemata erheblich verbessern.
Weng et al. (Tue,) haben diese Frage untersucht.