What question did this study set out to answer?

April 15, 2026Open Access

Uma Estratégia de Lances Adaptativa para Usinas de Energia Virtuais em Mercados de Dia Seguinte Sob Múltiplas Incertezas

Key Points

Esta pesquisa tem como objetivo desenvolver uma estratégia de lances adaptativa para usinas de energia virtuais a fim de abordar múltiplas incertezas nas condições de mercado.
Construído um modelo de agregação de VPP heterogêneo integrando armazenamento de energia, V2G e cargas flexíveis.
Projetado um mecanismo de modelagem de recompensa baseado em potencial para aprimorar a orientação estratégica de longo prazo.
Realizados experimentos comparativos multidimensionais em um mercado simulado de eletricidade de dia seguinte.
O algoritmo demonstra estabilidade de convergência robusta contra incertezas de preço de mercado e geração renovável.
Ele supera significativamente as estratégias tradicionais baseadas em regras em desempenho econômico.
A análise de mecanismos revela que o agente aprende um mecanismo de jogo dinâmico para melhor utilização do armazenamento de energia.

Abstract

Para abordar os desafios impostos por múltiplas incertezas nos sistemas de energia modernos ao ofertamento de mercados das Usinas de Energia Virtuais (VPPs), este artigo propõe uma estratégia de lances adaptativa baseada em Aprendizado por Reforço Profundo (DRL). Primeiro, um modelo de agregação de VPP heterogêneo integrando armazenamento de energia dedicado, Vehicle-to-Grid (V2G) e cargas flexíveis é construído, incorporando restrições físicas e operacionais complexas. Em segundo lugar, para superar o problema de 'otimalidade local míope' do DRL tradicional em tarefas de arbitragem temporal, um mecanismo de modelagem de recompensa baseado em potencial, vinculado a tendências de preços futuras, é projetado para guiar o agente em direção a estratégias ótimas de longo prazo. Por fim, experimentos comparativos multidimensionais e análises de mecanismos são realizados em um mercado simulado de eletricidade de dia seguinte. Os resultados da simulação demonstram o seguinte: (1) O algoritmo proposto apresenta estabilidade de convergência robusta e lida efetivamente com o ruído estocástico nos preços de mercado e na geração renovável. (2) Economicamente, a estratégia supera significativamente a estratégia baseada em regras e permanece altamente competitiva com a referência de otimização determinística sob suposições de informação perfeita. (3) A análise do mecanismo revela ainda que o agente DRL rompe a lógica rígida de limites fixos, aprendendo um mecanismo de jogo dinâmico não linear baseado em estados 'Preço-SOC', alcançando assim a utilização profunda total dos recursos de armazenamento de energia. Este trabalho fornece um paradigma interpretável orientado a dados para a tomada de decisões inteligente em VPP em ambientes incertos.

Bookmark

View Full Paper

Bookmark

View Full Paper

Uma Estratégia de Lances Adaptativa para Usinas de Energia Virtuais em Mercados de Dia Seguinte Sob Múltiplas Incertezas

Key Points

Abstract

Cite This Study