Key points are not available for this paper at this time.
تركز هذه الدراسة على مشكلة مهمة الإنقاذ، لا سيما تمكين الوكلاء/الروبوتات من التنقل بكفاءة في البيئات المجهولة. لقد زادت التقدمات التكنولوجية، بما في ذلك التصنيع وأنظمة الاستشعار والاتصال، من الاهتمام باستخدام الروبوتات أو الطائرات بدون طيار في عمليات الإنقاذ. تتطلب عمليات الإنقاذ الفعالة تحديد سريع للتغييرات في البيئة و/أو تحديد موقع الضحايا/الإصابات في أقرب وقت ممكن. تم تطوير العديد من التقنيات في السنوات الأخيرة لتحقيق الاستقلالية في مهام الإنقاذ، بما في ذلك تخطيط الحركة والتحكم التكيفي، ومؤخراً تقنيات تعلم التعزيز. تعتمد هذه التقنيات على المعرفة الكاملة بالبيئة أو توفر المحاكيات التي يمكن أن تمثل البيئات الواقعية خلال عمليات الإنقاذ. ومع ذلك، في الممارسة العملية، قد يكون لدى الوكلاء معلومات قليلة أو معدومة عن البيئة أو عدد أو مواقع الإصابات، مما يمنع/يحد من تطبيق معظم التقنيات الحالية. تقدم هذه الدراسة تمثيلاً احتماليًا/بيزيًا للبيئة المجهولة، والذي يقوم بنمذجة اللاحتمية في تنقل الوكيل وعدم اليقين البيئي في متجه يسمى حالة الاعتقاد. تسمح حالة الاعتقاد هذه بالتعلم غير المتصل عن سياسة بايز المثلى في بيئة مجهولة دون الحاجة إلى أي بيانات حقيقية/تفاعلات، مما يضمن اتخاذ إجراءات مثالية بالنظر إلى جميع المعلومات المتاحة. لمعالجة الحجم الكبير لمساحة الاعتقاد، تم تطوير تعلم التعزيز العميق لحساب سياسة تخطيط بيزية تقريبية. تظهر التجارب العددية باستخدام مشكلات المتاهة المختلفة الأداء العالي للسياسة المقترحة.
درس العي وآخرون (الخميس) هذا السؤال.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: