What type of study is this?

This is a Experimental Study study.

September 27, 2025Open Access

DreamerNav: التنقل المستقل القائم على التعلم في بيئات داخلية ديناميكية باستخدام نماذج العالم

Key Points

يمكن DreamerNav من أداء أفضل في التنقل المستقل في البيئات الداخلية الديناميكية.
يدمج النظام إدراكًا مكانيًا متعدد النماذج مع خريطة شغل محلية منظمة، مما يعزز من اكتشاف العقبات.
تسهّل صياغة التنقل كعملية قرار ماركوف جزئية الملاحظة (POMDP) اتخاذ قرارات فعالة في ظل عدم اليقين.
تُثبت التجارب الواقعية قوة الإطار عبر روبوتات رباعية القدمين مختلفة دون الحاجة لإعادة تدريب.

Abstract

يظل التنقل المستقل القوي في البيئات الداخلية المعقدة والديناميكية تحديًا مركزيًا في علم الروبوتات، حيث يتطلب من الوكلاء اتخاذ قرارات تكييفية في الوقت الفعلي تحت مستوى جزئي من الملاحظة وحركة العقبات غير المؤكدة. يقدم هذا البحث DreamerNav، إطار عمل للتنقل غير مرتبط بروبوت محدد، يقوم بتوسيع DreamerV3، وهو خوارزمية حديثة قائمة على نماذج العالم في التعلم المعزز، مع إدراك مكاني متعدد النماذج، تخطيط هجين عالمي-محلي، وتدريب مركّز على المناهج. من خلال صياغة التنقل كعملية قرار ماركوف جزئية الملاحظة (POMDP)، يمكّن النظام الوكلاء من دمج صور العمق الذاتية مع خريطة شغل محلية منظمة ترمز لمواقع العقبات الديناميكية، والمسارات التاريخية، ونقاط الاهتمام، ومسار A* العالمي. يتعلم نموذج الحالة المتكررة (RSSM) الديناميات الكامنة العشوائية والحتمية، مما يدعم التنبؤ الطويل المدى والتخطيط لمسار خالٍ من التصادم في مشاهد مزدحمة وديناميكية. يتم التدريب في محاكاة عالية الدقة، فوتو-واقعية باستخدام NVIDIA Isaac Sim، مع زيادة تدريجية في تعقيد المهام لتحسين استقرار التعلم، وكفاءة العينة، والتعميم. نقوم بمقارنة الأداء مع NoMaD و ViNT و A*، مما يُظهر معدلات نجاح وتكيف أفضل في البيئات الديناميكية. تختبر تجارب إثبات المفهوم في العالم الحقيقي على روبوتين رباعي القدمين دون الحاجة لإعادة تدريب، مما يعزز من قوة الإطار واستقلالية منصة الروبوتات الرباعية.

DreamerNav: التنقل المستقل القائم على التعلم في بيئات داخلية ديناميكية باستخدام نماذج العالم

Key Points

Abstract

Cite This Study