Key points are not available for this paper at this time.
मजबूत रिइंफोर्समेंट लर्निंग (RRL) एक प्रामाणिक रिइंफोर्समेंट लर्निंग (RL) दृष्टिकोण है जो अनिश्चितता या विघटन के प्रति मजबूत मॉडल तैयार करने के लिए लक्षित है, जिससे उन्हें वास्तविक दुनिया के अनुप्रयोगों के लिए अधिक कुशल बनाया जा सके। इस दृष्टिकोण को अपनाते हुए, अनिश्चितता या विघटन को एक दूसरे प्रतिकूल एजेंट की क्रियाओं के रूप में व्याख्यायित किया जाता है, और इस प्रकार, समस्या को किसी भी विपक्षी के कार्यों के प्रति मजबूत एजेंट नीतियों की खोज तक सीमित कर दिया जाता है। यह लेख पहली बार RRL समस्याओं को स्थानिक विभाजन खेल सिद्धांत के भीतर विचार करने का प्रस्ताव देता है, जो हमें केंद्रीकृत Q-लर्निंग दृष्टिकोण विकसित करने के लिए सिद्धांतिक रूप से उचित अंतर्दृष्टि प्राप्त करने में मदद करता है। अर्थात्, हम साबित करते हैं कि आइज़ैक की स्थिति (वास्तविक दुनिया के गतिशील प्रणालियों के लिए पर्याप्त रूप से सामान्य) के तहत, वही Q-फंक्शन दोनों मिनीमैक्स और मैक्सिमिन बेलमैन समीकरणों के लगभग समाधान के रूप में उपयोग किया जा सकता है। इन परिणामों के आधार पर, हम आइज़ैक गहरे Q-नेटवर्क एल्गोरिदम प्रस्तुत करते हैं और विभिन्न वातावरणों में अन्य बुनियादी RRL और मल्टी-एजेंट RL एल्गोरिदम की तुलना में उनकी श्रेष्ठता को प्रदर्शित करते हैं।
प्लाक्सिन एट अल। (शुक्र,) ने इस प्रश्न का अध्ययन किया।
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: