What question did this study set out to answer?

Enquête sur l'optimisation de la charge pour les batteries quantiques Dicke inhomogènes en utilisant l'apprentissage par renforcement.

March 14, 2026Open Access

Apprentissage par renforcement pour l'optimisation de la charge des batteries quantiques Dicke inhomogènes

Key Points

Enquête sur l'optimisation de la charge pour les batteries quantiques Dicke inhomogènes en utilisant l'apprentissage par renforcement.
Application de l'apprentissage par renforcement pour développer des politiques de charge par morceaux constantes.
Comparaison des politiques à travers quatre régimes d'observabilité.
Analyse des performances avec accès à l'état complet et mesures d'observabilité partielle.
L'observabilité à état complet fournit une ergotropie presque optimale avec une faible variabilité.
Sous observabilité partielle, l'accès aux énergies de TLS uniques et aux moyennes d'ordre un a un rendement inférieur à celui de l'observation complète.
L'inclusion de corrélations d'ordre deux dans les observations partielles récupère 94 % à 98 % des performances de référence complète.

Abstract

L'optimisation de la charge est un défi clé pour la mise en œuvre des batteries quantiques, en particulier en cas d'inhomogénéité et d'observabilité partielle. Cet article utilise l'apprentissage par renforcement pour optimiser les politiques de charge par morceaux constantes pour une batterie Dicke inhomogène. Nous comparons systématiquement les politiques à travers quatre régimes d'observabilité, de l'accès à l'état complet aux observables accessibles expérimentalement (énergies de systèmes à deux niveaux (TLS), moyennes d'ordre un, et corrélations d'ordre deux). Les résultats de simulation montrent que l'observabilité complète offre une ergotropie presque optimale avec une faible variabilité, tandis qu'en cas d'observabilité partielle, l'accès uniquement aux énergies de TLS uniques ou aux énergies plus moyennes d'ordre un est moins performant que la référence complètement observée. Cependant, l'augmentation des observations partielles avec des corrélations d'ordre deux récupère la majeure partie de l'écart, atteignant 94 % à 98 % de la référence à état complet. Les horaires appris ne sont pas myopiques, échangeant des plateaux temporaires ou des déclins pour de meilleurs résultats finaux. Ces découvertes mettent en évidence une voie pratique vers des protocoles de charge rapide efficaces sous des contraintes d'information réalistes.

Bookmark

View Full Paper

Bookmark

View Full Paper

Apprentissage par renforcement pour l'optimisation de la charge des batteries quantiques Dicke inhomogènes

Key Points

Abstract

Cite This Study