What question did this study set out to answer?

लक्ष्य है एंबोडीड इंटेलिजेंस के विकास का अन्वेषण करना, जिसमें डेटा, मॉडल और सिस्टम की चुनौतियों का समाधान किया जाए।

April 10, 2026Open Access

एंबोडीड इंटेलिजेंस का भविष्य: डेटा, मॉडल और सिस्टम का विकास

Key Points

लक्ष्य है एंबोडीड इंटेलिजेंस के विकास का अन्वेषण करना, जिसमें डेटा, मॉडल और सिस्टम की चुनौतियों का समाधान किया जाए।
एंबोडीड इंटेलिजेंस की वर्तमान स्थिति की समीक्षा की गई, जिसमें डेटा, मॉडल, सिस्टम और मूल्यांकन के चार आयामों को शामिल किया गया।
भौतिक समझ के लिए डेटा संग्रह और उपयोग को संरचित करने हेतु 'डेटा पिरामिड' प्रस्तावित किया।
प्रमुख विजुअल-भाषा-कार्य मॉडल की विस्तार सीमाओं का परीक्षण किया और 'वर्ल्ड मॉडल' की अवधारणा पेश की।
बेहतर सेमांटिक योजना और मोटर नियंत्रण पृथक्करण के लिए एंड-टू-एंड मॉडलों से स्तरीय आर्किटेक्चर की ओर बदलाव का विश्लेषण किया।
वास्तविकता और पुनरुत्पादकता की चुनौतियों के लिए वर्तमान मूल्यांकन ढांचे का मूल्यांकन किया।
डेटा को एक संरचित तरीका प्रस्तुत किया जो भौतिक सामान्य ज्ञान और व्यवहार मानचित्रण को बढ़ावा देता है।
'वर्ल्ड मॉडल' को भौतिक अंतर्ज्ञान सुधारने की एक आशाजनक नई दिशा के रूप में पहचाना।
स्तरीय आर्किटेक्चर की ओर संक्रमण को नोट किया, जो योजना और नियंत्रण में अधिक लचीलापन प्रदान करता है।
मौजूदा मूल्यांकन प्रणालियों में, विशेष रूप से यथार्थवाद और पुनरुत्पादकता के संदर्भ में जारी चुनौतियों को उजागर किया।

Abstract

एंबोडीड इंटेलिजेंस, जो कि आर्टिफिशियल इंटेलिजेंस के विकास का एक महत्वपूर्ण क्षेत्र है, डेटा की विषमता, कड़े भौतिक प्रतिबंधों और महंगा इंटरैक्शन जैसी चुनौतियों का सामना कर रहा है, जिससे बड़े भाषा मॉडलों के "बड़ी स्केल पर प्रीट्रेनिंग + स्केल लॉ" के पैरेडाइम को सीधे लागू करना कठिन हो जाता है। यह लेख डेटा, मॉडल, सिस्टम और मूल्यांकन के चार आयामों से एंबोडीड इंटेलिजेंस की अग्रणी तकनीकी प्रगति का व्यापक अवलोकन प्रस्तुत करता है। डेटा स्तर पर, लेख एक "डेटा पिरामिड" संरचना का प्रस्ताव करता है, जो विशाल सिमुलेशन और इंटरनेट वीडियो डेटा का उपयोग करके भौतिक सामान्य ज्ञान का निर्माण करने, मध्यम स्तर पर मानव इंटरैक्शन डेटा के माध्यम से व्यवहार मानचित्रण करने और अंत में शीर्ष स्तर पर सीमित असली मशीन डेटा के जरिए कौशल को लागू करने की वकालत करता है। मॉडल स्तर पर, यह प्रमुख विजुअल-लैंग्वेज-एक्शन (VLA) मॉडलों के विस्तार सीमाओं पर चर्चा करता है और "वर्ल्ड मॉडल" को एक नई दिशा के रूप में प्रस्तुत करता है, जो पर्यावरण की डायनेमिक्स का अनुकरण और भविष्य की पूर्वाभ्यास के द्वारा एजेंट को बेहतर भौतिक अंतर्ज्ञान और सामान्यीकरण क्षमता प्रदान कर सकता है। सिस्टम स्तर पर, देखा गया है कि आर्किटेक्चर एकल एंड-टू-एंड मॉडल से ऑपरेटिंग सिस्टम जैसी "स्तरीय संरचना" की ओर विकसित हो रहा है, जिससे उच्च स्तरीय सेमांटिक योजना और निचले स्तर के मोटर नियंत्रण का पृथक्करण संभव हो जाता है। अंत में, यह लेख वर्तमान मूल्यांकन प्रणाली की वास्तविकता और पुनरुत्पाद्यता से संबंधित चुनौतियों की समीक्षा करता है और चलने तथा संचालन के एकीकरण और एंबोडीड इंटेलिजेंस के "ImageNet क्षण" के आगमन की संभावनाओं पर प्रकाश डालता है।

Bookmark

View Full Paper

Bookmark

View Full Paper

एंबोडीड इंटेलिजेंस का भविष्य: डेटा, मॉडल और सिस्टम का विकास

Key Points

Abstract

Cite This Study