Key points are not available for this paper at this time.
विभिन्न परिदृश्यों का निर्माण सिमुलेशन के माध्यम से सुरक्षा-आधारित प्रणाली, जैसे कि स्वायत्त वाहनों, को प्रशिक्षित और मूल्यांकन करने के लिए महत्वपूर्ण है। फिर भी, अन्य वाहनों की पथों का मॉडलिंग करना, ताकि विविध और अर्थपूर्ण निकट अंतःक्रियाओं का सिमुलेट किया जा सके, बहुत महंगा है। ड्राइविंग व्यवहार उत्पन्न करने के लिए भाषा वर्णनों का उपयोग करना एक संभावित रणनीति के रूप में उभरता है, जो मानव ऑपरेटरों को ड्राइविंग अंतःक्रियाओं की एक विस्तृत श्रृंखला का सिमुलेट करने के लिए एक स्केलेबल और सहज विधि प्रदान करता है। हालाँकि, बड़े पैमाने पर एनोटेटेड भाषा-पथ डेटा की कमी इस दृष्टिकोण को चुनौतीपूर्ण बनाती है। इस खाई को भरने के लिए, हम टेक्स्ट-टू-ड्राइव (T2D) का प्रस्ताव करते हैं ताकि बड़े भाषा मॉडलों (LLMs) के माध्यम से विविध ड्राइविंग व्यवहारों का सिंथेसिस किया जा सके। हम एक ज्ञान-आधारित दृष्टिकोण प्रस्तुत करते हैं जो दो चरणों में काम करता है। पहले चरण में, हम एक दृश्य के लिए ड्राइविंग व्यवहारों के विविध भाषा वर्णनों को उत्पन्न करने के लिए LLMs के अंतर्निहित ज्ञान का उपयोग करते हैं। फिर, हम सिमुलेशन में इन व्यवहारों को सिंथesize करने के लिए LLM की तर्कशील क्षमताओं का लाभ उठाते हैं। इसके मूल में, T2D एक LLM का उपयोग करता है ताकि एक स्थिति चार्ट बनाया जा सके जो निम्न-स्तरीय स्थितियों को उच्च-स्तरीय अमूर्तताओं से जोड़ता है। यह रणनीति नीचे के कार्यों में मदद करती है जैसे कि निम्न-स्तरीय अवलोकनों को संक्षेपित करना, व्यवहार वर्णन के साथ नीति के समन्वय का मूल्यांकन करना, और सहायक पुरस्कार को आकार देना, सभी बिना मानव पर्यवेक्षण की आवश्यकता के। हमारे ज्ञान-आधारित दृष्टिकोण के साथ, हम प्रदर्शित करते हैं कि T2D अन्य बासेलाइनों की तुलना में अधिक विविध पथ उत्पन्न करता है और एक प्राकृतिक भाषा इंटरफेस प्रदान करता है जो मानव पसंद के इंटरैक्टिव समावेश की अनुमति देता है। अधिक उदाहरणों के लिए कृपया हमारी वेबसाइट देखें: https://text-to-drive.github.io/
Nguyeन एट अल। (गुरुवार) ने इस प्रश्न का अध्ययन किया।