يظل التنقل المستقل القوي في البيئات الداخلية المعقدة والديناميكية تحديًا مركزيًا في علم الروبوتات، حيث يتطلب من الوكلاء اتخاذ قرارات تكييفية في الوقت الفعلي تحت مستوى جزئي من الملاحظة وحركة العقبات غير المؤكدة. يقدم هذا البحث DreamerNav، إطار عمل للتنقل غير مرتبط بروبوت محدد، يقوم بتوسيع DreamerV3، وهو خوارزمية حديثة قائمة على نماذج العالم في التعلم المعزز، مع إدراك مكاني متعدد النماذج، تخطيط هجين عالمي-محلي، وتدريب مركّز على المناهج. من خلال صياغة التنقل كعملية قرار ماركوف جزئية الملاحظة (POMDP)، يمكّن النظام الوكلاء من دمج صور العمق الذاتية مع خريطة شغل محلية منظمة ترمز لمواقع العقبات الديناميكية، والمسارات التاريخية، ونقاط الاهتمام، ومسار A* العالمي. يتعلم نموذج الحالة المتكررة (RSSM) الديناميات الكامنة العشوائية والحتمية، مما يدعم التنبؤ الطويل المدى والتخطيط لمسار خالٍ من التصادم في مشاهد مزدحمة وديناميكية. يتم التدريب في محاكاة عالية الدقة، فوتو-واقعية باستخدام NVIDIA Isaac Sim، مع زيادة تدريجية في تعقيد المهام لتحسين استقرار التعلم، وكفاءة العينة، والتعميم. نقوم بمقارنة الأداء مع NoMaD و ViNT و A*، مما يُظهر معدلات نجاح وتكيف أفضل في البيئات الديناميكية. تختبر تجارب إثبات المفهوم في العالم الحقيقي على روبوتين رباعي القدمين دون الحاجة لإعادة تدريب، مما يعزز من قوة الإطار واستقلالية منصة الروبوتات الرباعية.
شينكس وآخرون (الجمعة) درسوا هذا السؤال.