Key points are not available for this paper at this time.
تعتبر ألعاب ستاكلبرغ (SGs) النماذج الأكثر أساسية ورواجًا للتفاعلات الاستراتيجية التي تشمل نوعًا ما من الالتزام. علاوة على ذلك، تشكل أساس نماذج أكثر تعقيدًا من هذا القبيل، مثل الإقناع البايزي ومشكلات الوكيل principal-agent. يعتبر معالجة مهام التعلم في ألعاب SGs والنماذج ذات الصلة أمرًا بالغ الأهمية لتشغيلها في الممارسة العملية، حيث تكون معلمات النموذج عادة غير معروفة. في هذه الورقة، نقوم بمراجعة تعقيد العينة لتعلم استراتيجية مثلى للتزام بها في ألعاب SGs. نقدم خوارزمية جديدة لا تتطلب أي من الافتراضات المحدودة التي وضعتها الأساليب الحديثة، وتتعامل مع مقايضة بين تعقيد العينة واحتمالية الإنهاء عندما تكون تمثيلات استراتيجيات القائد ذات دقة محدودة. لقد تم تجاهل مثل هذه المقايضة تمامًا من قبل الخوارزميات الموجودة، وإذا لم تتم إدارتها بشكل صحيح، فقد تؤدي إلى استخدامها لعدد exponentially كبير من العينات. تتطلب خوارزميتنا تقنيات جديدة، والتي تمهد أيضًا الطريق لمعالجة مشكلات التعلم في نماذج أخرى مع الالتزام المنتشر في العالم الحقيقي.
درس باكيوكي وعملاؤه (Sat,) هذا السؤال.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: