Key points are not available for this paper at this time.
हाल ही में बड़े भाषा मॉडलों (LLMs) ने शानदार प्रगति की है, और अब मॉडल विभिन्न कार्यों में उत्कृष्टता प्राप्त कर रहे हैं, जैसे गणितीय तर्क और प्रोग्राम संश्लेषण। हालाँकि, उनके लिए API कॉल के माध्यम से उपकरणों का प्रभावी ढंग से उपयोग करने की क्षमता पूरी नहीं हुई है। यह आज के अत्याधुनिक LLMs जैसे GPT-4 के लिए एक चुनौतीपूर्ण कार्य है, मुख्यतः उनके सटीक इनपुट तर्कों को उत्पन्न करने में असमर्थता और API कॉल के गलत उपयोग की दृष्टि से हॉलुसिनेट करने की प्रवृत्ति के कारण। हम गोरिल्ला, एक फाइन-ट्यून किए गए LLaMA-आधारित मॉडल को पेश करते हैं जो API कॉल लिखने में GPT-4 के प्रदर्शन को पार करता है। जब इसे एक दस्तावेज़ पुनर्प्राप्तकर्ता के साथ जोड़ा जाता है, तो गोरिल्ला परीक्षा के समय दस्तावेज़ परिवर्तनों के अनुकूल होने की एक मजबूत क्षमता प्रदर्शित करता है, जो लचीले उपयोगकर्ता अपडेट या संस्करण परिवर्तनों को सक्षम करता है। यह सीधे LLMs को उत्तेजित करते समय सामान्यतः सामना की जाने वाली हॉलुसिनेशन की समस्या को भी काफी हद तक कम करता है। मॉडल की क्षमता का मूल्यांकन करने के लिए, हम APIBench पेश करते हैं, जो HuggingFace, TorchHub, और TensorHub APIs का एक व्यापक डेटा सेट है। गोरिल्ला के साथ पुनर्प्राप्ति प्रणाली का सफल एकीकरण LLMs के उपकरणों का अधिक सटीकता से उपयोग करने की संभावनाएं दिखाता है, अक्सर अद्यतन दस्तावेज़ों के साथ तालमेल बनाए रखता है, और इस प्रकार उनके आउटपुट की विश्वसनीयता और अनुप्रयोगशीलता बढ़ाता है। गोरिल्ला का कोड, मॉडल, डेटा और डेमो https://gorilla.cs.berkeley.edu पर उपलब्ध है।
पाटिल एट अल। (बुधवार,) ने इस प्रश्न का अध्ययन किया।