February 29, 2024

मल्टी-एजेंट रिइन्फोर्समेंट लर्निंग में पर्यावरणों के डिज़ाइन के लिए मॉडल एक कुंजी कारक के रूप में

Key Points

Key points are not available for this paper at this time.

Abstract

यह पेपर मार्कोव निर्णय प्रक्रियाओं (MDPs) के विकास में वर्तमान कला की एक सामान्यीकृत ग्राफिकल रूपरेखा प्रस्तुत करता है। यह प्रणालीकरण रिइन्फोर्समेंट लर्निंग (RL) के क्षेत्र को आगे सुधारने के तरीकों को खोलता है, नए या संशोधित मौजूदा MDP मॉडल पर आधारित RL एल्गोरिदम बनाकर। यह पेपर RL पर्यावरणों का अवलोकन और मल्टी-एजेंट रिइन्फोर्समेंट लर्निंग के लिए विभिन्न पर्यावरणों के उपयोग का प्रयोगात्मक परिणाम प्रस्तुत करता है। MDP मॉडलों के प्रयोगात्मक शोध को मशीन लर्निंग के मानक डिजिटल पर्यावरणों में किया गया: MuJoCo और SMAC।

Bookmark

मल्टी-एजेंट रिइन्फोर्समेंट लर्निंग में पर्यावरणों के डिज़ाइन के लिए मॉडल एक कुंजी कारक के रूप में

Key Points

Abstract

Cite This Study

Also Consider

Also Consider