Los puntos clave no están disponibles para este artículo en este momento.
El estudio explora el uso del aprendizaje profundo por refuerzo (DRL) para optimizar sistemas de calefacción, ventilación y aire acondicionado, con el fin de reducir el consumo de energía mientras se mantiene el confort interior. Los métodos de control tradicionales, como el Control Predictivo Basado en Modelos y el control Proporcional-Integral-Derivativo, a menudo tienen dificultades con las condiciones ambientales variables, lo que lleva a un uso ineficiente de la energía y a la incomodidad. Esta investigación presenta un enfoque basado en DRL, mejorando el rendimiento de optimización del algoritmo al filtrar, mediante la entropía, la información de alto valor y reduciendo errores de valor. Utilizando la plataforma de simulación de edificios Energym, se comparó el rendimiento de varios algoritmos de aprendizaje por refuerzo, incluidos el Gradiente de Política Determinista Profundo (DDPG) y el Actor-Crítico Suave (SAC), en diferentes condiciones climáticas. Demostramos un nuevo algoritmo de DRL, EntropySAC, que mostró ahorros energéticos significativos y mejor control del confort. Notablemente, el algoritmo optimizado redujo el consumo de energía en hasta un 38.95% bajo condiciones de altas temperaturas y superó consistentemente los enfoques tradicionales.
Zhang et al. (Mié,) estudiaron esta cuestión.