Key points are not available for this paper at this time.
من أجل الانتقال في قطاع الإسكان، تعتبر مضخات الحرارة تقنية أساسية لإزالة الكربون من إنتاج الطاقة الحرارية للتدفئة والحمامات المنزلية. يمكن أيضًا أن تساهم توليد الطاقة من أنظمة الطاقة الشمسية الكهروضوئية (PV) المثبتة في الموقع في تحقيق مباني محايدة الكربون. ومع ذلك، فإن كلاهما سيزيد من الضغط على شبكة الكهرباء. يمكن تقليل ذلك من خلال استخدام استراتيجيات تحكم مناسبة لمطابقة استهلاك الكهرباء وإنتاجها. في السنوات الأخيرة، أصبحت الأساليب المعتمدة على الذكاء الاصطناعي مثل التعلم المعزز (RL) تحظى بشعبية متزايدة لإدارة أنظمة الطاقة. ومع ذلك، تبرز الأدبيات نقص البحث في وحدات التحكم المعتمدة على التعلم المعزز لأنظمة الطاقة في المباني متعددة العائلات، بما في ذلك مضخة حرارية مصدرها الهواء، وتخزين حراري، ونظام طاقة شمسية كهروضوئية، على الرغم من أن هذه هي تكوينات نظام شائعة. لذلك، في هذه الدراسة، تم تطوير نموذج لمثل هذا النظام الطاقي ووحدات تحكم معتمدة على التعلم المعزز وتمت محاكاتها بواسطة نماذج فيزيائية ومقارنتها مع الأساليب التقليدية المعتمدة على القواعد. تم دراسة أربع خوارزميات للتعلم المعزز لهدفين، وفي النهاية، تم اختيار خوارزمية الممثل الناعم-الناقد للمحاكاة السنوية. كان الهدف الأول، للحفاظ على درجات الحرارة المطلوبة فقط في التخزين الحراري، قابلاً للتحقيق بواسطة الوكيل المعتمد على التعلم المعزز المتطور. ومع ذلك، كان الهدف الثاني، لتحسين استهلاك الطاقة الشمسية الذاتي، أفضل تحقيقًا بواسطة وحدة التحكم المعتمدة على القواعد. لذلك، يُقترح المزيد من البحث في دالة المكافأة، والمعاملات الفائقة، والطرق المتقدمة، بما في ذلك طبقات الذاكرة طويلة وقصيرة المدى، بالإضافة إلى تدريب لفترات زمنية أطول من ستة أيام.
درس باختسايتز وآخرون (الأربعاء) هذا السؤال.