May 3, 2024Open Access

ज़ीरो-सम स्थानिक विभाजन खेल एक मजबूत reinforcement learning के ढांचे के रूप में: गहरी Q-लर्निंग दृष्टिकोण

Key Points

Key points are not available for this paper at this time.

Abstract

मजबूत रिइंफोर्समेंट लर्निंग (RRL) एक प्रामाणिक रिइंफोर्समेंट लर्निंग (RL) दृष्टिकोण है जो अनिश्चितता या विघटन के प्रति मजबूत मॉडल तैयार करने के लिए लक्षित है, जिससे उन्हें वास्तविक दुनिया के अनुप्रयोगों के लिए अधिक कुशल बनाया जा सके। इस दृष्टिकोण को अपनाते हुए, अनिश्चितता या विघटन को एक दूसरे प्रतिकूल एजेंट की क्रियाओं के रूप में व्याख्यायित किया जाता है, और इस प्रकार, समस्या को किसी भी विपक्षी के कार्यों के प्रति मजबूत एजेंट नीतियों की खोज तक सीमित कर दिया जाता है। यह लेख पहली बार RRL समस्याओं को स्थानिक विभाजन खेल सिद्धांत के भीतर विचार करने का प्रस्ताव देता है, जो हमें केंद्रीकृत Q-लर्निंग दृष्टिकोण विकसित करने के लिए सिद्धांतिक रूप से उचित अंतर्दृष्टि प्राप्त करने में मदद करता है। अर्थात्, हम साबित करते हैं कि आइज़ैक की स्थिति (वास्तविक दुनिया के गतिशील प्रणालियों के लिए पर्याप्त रूप से सामान्य) के तहत, वही Q-फंक्शन दोनों मिनीमैक्स और मैक्सिमिन बेलमैन समीकरणों के लगभग समाधान के रूप में उपयोग किया जा सकता है। इन परिणामों के आधार पर, हम आइज़ैक गहरे Q-नेटवर्क एल्गोरिदम प्रस्तुत करते हैं और विभिन्न वातावरणों में अन्य बुनियादी RRL और मल्टी-एजेंट RL एल्गोरिदम की तुलना में उनकी श्रेष्ठता को प्रदर्शित करते हैं।

ज़ीरो-सम स्थानिक विभाजन खेल एक मजबूत reinforcement learning के ढांचे के रूप में: गहरी Q-लर्निंग दृष्टिकोण

Key Points

Abstract

Cite This Study

Also Consider

Also Consider